论文部分内容阅读
艾滋病也称获得性免疫缺陷综合症(Acquired Immunod-Eficiency Syndrome,AIDS),由人类免疫缺陷病毒(human immunodeficiency virus,HIV-1)引起,严重威胁着人类的生命健康,成为全世界祈待攻克的一个难关。近年来,HIV-1整合酶(IN)已成为研发抗AIDS药物的最具吸引力的靶标,针对IN的药物开发成为热点。然而,耐药性的出现成为AIDS治疗失败的主要原因。耐药性的出现使如何指导临床医生合理用药,以及高效快速的研发新药更为迫切。通过将耐药突变株的药物敏感性即表现型与耐药突变即基因型之间建立相关性模型,可预测新突变株对该抑制剂的敏感性,从而为临床医生提供用药指导。 本研究基于斯坦福耐药数据库,建立了IN对抑制剂EVG产生耐药突变的基因型与表现型一一对应的数据集。根据同一位点不同耐药突变导致残基侧链理化性质的变化是否一致:侧链的体积变化、电荷性质变化、以及综合考虑体积和电荷变化,对数据集中的基因型进行了三种不同的整合。最后,基于遗传算法(GA)与逐步回归方法,分别得到三个预测模型。模型评价结果表明,三个模型回归方程中各基因的权重系数均很好的与实验结果相吻合,模型具有较高的可信度。综合考虑突变残基侧链体积和电荷变化的体积&电荷模型精确度最高,其训练集和预测集的R2分别为0.77和0.78,其ROC曲线下面积AUC也最高,训练集和预测集的AUC分别为0.942和0.962,此外,该模型还具有最高的显著性与最低的误差。最后,建立了人工神经网络模型,比较人工神经网络模型与逐步回归模型的分类预测正确率,结果表明,人工神经网络模型与逐步回归模型都具有较高的正确率,且逐步回归模型的分类预测正确率高于人工神经网络模型。综合以上结果可见,研究所得回归模型中的体积&电荷模型最合理可靠。 本研究所得的体积&电荷回归模型可用于快速预测新突变对EVG的耐药性,可以对临床医生的用药提供一定的指导,对加快发展精准医疗与个性化医疗起到一定的帮助。