论文部分内容阅读
药物不良反应(Adverse drug reactions,ADRs)是一个临床药物治疗中严重的医学和社会问题,也是导致新药无法通过临床测试以及导致药物退市的主要因素之一。但目前国内外还没有一种方法体系可以系统性、普遍性地解释ADR发生的底层分子机制,进而用于ADR评估和预测。而实验室研究结果和临床观测数据之间的不对称,造成ADR的数据采集不足,更加重了ADR研究的困难。随着生物信息学和系统生物学在毒理学研究中的广泛应用,我们急需一个专门的ADR知识本体系统而不仅仅是一个简单的医学词典。基于这一目标,本研究构建了国际上首个药物不良反应知识本体库ADReCS,提供标准的ADR术语和层级分类信息,并使用分级数字ID,体现ADR层级之间的关联。迄今为止,ADReCS系统已收录了6,749个标准ADR术语和36,107个ADR同义词,包含了1,698个小分子药物信息和154,355对非冗余的药物-ADR关系对。ADReCS的构建将为计算机方法的ADR大规模系统研究提供数据支持。 基于ADReCS数据,我们从药物适应症、药物结构和药物靶点三方面对ADR进行大规模的关联研究。我们发现药物诱发不良反应的发生与其药效作用紧密相关,相同治疗功能的药物容易发生相似的不良反应,据此我们提出了一种基于网络的药物功能预测方法。构建ADR相似性药物-药物网络,从中获取了47个紧密相连的药物功能模块,预测了1,777个药物-适应症关系对。我们根据药物的ATC分类,证实了72%的药物-适应症关系对中,药物确实具有相同的治疗功能。而模块中ATC分类不同或未知的药物与具有相同治疗功能的药物紧密相连,可能暗示了药物潜在的新功能。 同时,为了阐明药物化学结构对药物不良反应发生的影响,我们基于药物的子结构信息(分子指纹)与药物不良反应进行关联分析,发现了455个ADR与至少一个子结构具有显著相关性(q<0.01)。依据ADR的关联子结构,我们以血管神经性水肿为例,选用了四种机器学习算法(贝叶斯网络、决策树J48、随机森林和支持向量机)分别构建血管神经性水肿的快速预测模型。其中贝叶斯网络模型的预测效果最佳,十重交叉验证和外部测试集验证的预测准确率都达到了70%。通过研究,我们找到了ADR关联的子结构,可用于药物研发早期阶段的药物安全性评估,同时可以为新药研发时药物结构和基团的选择提供理论指导。 此外,在识别与ADR发生关联的靶点时,为获取较为完整的药物靶点信息,我们通过INVDOCK反向对接方法搜索药物潜在靶点,从预测结果可以发现,INVDOCK预测的药物潜在蛋白靶点数目与药物的ADR数目呈一定的正相关关系。之后与DrugBank和PubChem BioAssay数据库的药物靶点信息进行整合、关联分析,共获取了20,651对ADR-靶点关联,涉及1,519个靶点与775个ADRs。与DITOP中获取的已有文献支持的ADR相关蛋白比较,接近50%的已知ADR相关蛋白在我们的关联结果中发现;而其他没有文献支持的ADR关联靶点,很多与已知靶点参与相同的通路。通过关联分析方法可以快速获取ADR关联靶点,有助于了解ADR的发生机制和进行药物安全性评估,或许可以成为现有实验方法的有益补充。 综上所述,基于大规模关联研究不良反应与药物各种属性之间的关系,可以系统全面地了解药物不良反应的发生特征,为全面系统研究ADR的底层机制和药物研发早期的ADR预测奠定基础。