论文部分内容阅读
随着高通量筛选技术、组合化学技术以及平行合成技术的出现,基于实验研究而产生的数据信息已经越来越多,尤其是在药物化学领域。然而怎样在大量的化学信息宝库中抽取有用的信息呢?面对这一难题,本文试图使用化学信息学的方法来解决。药物设计是化学信息学方法应用的重要领域,原因在于:一是开发一种新药需要大量的花费且周期十分漫长;二是需要从实验产生的大量数据中抽取有用的信息。本文主要采用了分类方法、回归方法以及组合(三维定量构效关系方法、分子对接方法和分子动力学方法的组合)方法解决了药物设计中涉及的两个相关问题:第一,通过建立活性预测模型来筛选出理想的化合物探针分子;第二,从分子水平上来理解小分子与靶标的作用机制。具体的研究内容如下:(1)使用随机森林耦合变量选择算法对RSV抑制剂以及人类β3-AR激动剂建立分类模型来筛选理想的药物分子,通过计算可知这两个新建的分类模型对外部验证集的预测准确率都达到90%以上。(2)使用随机森林算法组合Mold2描述符对190个结构多样的FBPase抑制剂进行活性预测,并且使用遗传算法对其进行描述符子集选择,最终建立的模型不但具有满意的预测能力,而且能鉴别出与FBPase抑制剂活性相关的重要描述符。同时作者也提出用遗传算法耦合支持向量回归技术对P2Y12拮抗剂进行预测,该算法可以同时实现对描述符进行选择和对支持向量机参数进行优化,这样不但可以大大增加模型的计算效率,而且提高了模型的预测能力。该模型最终给出交叉验证相关系数r2cv=0.83,外部验证集预测相关系数r2pred=0.81。使用建立的模型可以在药物合成前对P2Y12拮抗剂进行筛选、预测和优化。(3)使用三维定量构效关系、分子对接和分子动力学三者组合的方法对P2Y12拮抗剂、5-HT6受体配体以及FIXa、MK-2、PKCθ抑制剂建立计算模型。建立的模型不但在统计上可信,而且可以从分子水平观察小分子与其靶标之间的作用模式,这为化合物的合理修饰提供了理论指导。总之,本文所建立的分类模型和回归模型都展示出了较高的预测能力,它们在药物开发的早期便可以筛选出理想的药物分子。使用三维定量构效关系方法、分子对接方法和分子动力学方法所得结论的一致性表明了本文所建立的模型是合理的,它们可以为以后合成高活性的药物分子提供强有力的理论支持。