论文部分内容阅读
定量构效关系(定量结构-活性/性质相关,Quantitative Structure-Activity/Property Relationship)方法已成为国际上一个活跃的研究领域,QSAR/QSPR的研究对象包括化合物的各种生物活性、毒性、药物的各种代谢动力学参数和生物利用度以及分子的各种物理化学性质和环境行为等,研究领域涉及化学、生物、医学以及环境等诸多学科。QSAR/QSPR方法从化合物的分子结构和活性/性质的实验结果出发,依据不同的需要和研究深度,可建立相关的二维(2-D)或三维(3-D)模型,来预测未知化合物的性质、生物活性和生态学效应等。本论文从分子结构的定量描述和结构性质定量关系的建立入手,总结了QSAR/QSPR方法在环境效应评价和药物设计方面的应用。同时,着重讨论了一种机器学习算法:径向基函数神经网络(Radial Basis Function Neural Networks,RBFNN)方法建立高效、稳定的QSAR模型。论文第一章介绍了定量构效关系的发展历史、基本原理、方法以及研究进展。同时,详细介绍了RBFNN算法的基本原理并总结了它在近年来的一些重要应用。论文第二章介绍了QSAR/QSPR方法和RBFNN算法在环境科学中的应用。近年来,大量化学品广泛使用在各个领域并排放到环境中,对人类和生态系统构成了潜在的毒性危害。用QSAR方法建立模型来预测化合物的毒性效应,为风险评估提供科学依据。同时,缩短了研究时间并大大降低实验花费。1.应用QSPR方法研究了66个有机污染物在生物分配胶束色谱中的保留行为。运用启发式方法和RBFNN方法分别建立了这些化合物的结构与其色谱保留值之间的线性和非线性模型。两种方法的相关系数(R~2)分别为0.8400和0.8642,相应的均方根误差(RMS)为0.1577和0.1562。通过对两种模型的稳定性和预测能力的比较,发现所选描述符与保留值存在显著线性关系,非线性方法对模型的预测能力改善不是很大。2.QSAR方法用于预测91个有机污染物对小球藻的毒性。用启发式方法和RBFNN算法建立了两种预测模型,它们对测试集预测结果的均方根误差(RMS)分别为0.4023和0.3124。可以看出,RBFNN模型有很好的预测能力。通过多种方法对所建模型进行评价,包括多样性分析、应用领域分析和模型的预测能力评估。对所选描述符进行合理解释,有利于发现毒性机理,能够为境评估做出新的贡献。论文第三章介绍了QSAR方法和算法在医学、药物设计中的应用。简单描述如下:1.应用启发式方法和RBFNN算法分别建立了58个非苯并二氮类药物配体与苯并二氮受体的键合亲和力的定量结构-活性关系模型。并探讨了了影响两者键合的结构因素。预测结果表明,RBFNN性能要优于HM。配体的大小、极性、疏水性是影响配体与受体键合的主要结构因素。RBFNN模型简单快捷,在药物设计中可以用来预测候选药物的键合亲和力。2.应用多元线性回归和RBFNN方法分别建立了线性和非线性模型,预测61个4-(3-溴胺)-6,7-二甲基喹唑啉对表皮生长因子受体(EGFR)的抑制活性。它们对测试集预测的相关系数(R)分别为0.8688和0.9030。RBFNN模型的预测结果更为准确。量子化学描述符对此类药物的设计有重要影响。