论文部分内容阅读
本研究报导了包含1273个分子的P糖蛋白(P-glycoprotein)抑制剂和非抑制剂数据集,并基于该数据集构建了P糖蛋白抑制剂的预测模型.研究首先分析了几种重要的分子理化性质对化合物P糖蛋白抑制活性的影响;然后,采用递归分割方法建立了P糖蛋白抑制剂的决策树分类模型,最佳的决策树模型对测试集的P糖蛋白抑制剂和非抑制剂的预测精度分别为83.5%和67.0%;最后,采用朴素贝叶斯分类方法构建了P糖蛋白抑制剂的预测模型,模型对973个分子的训练集和300个分子的测试集的整体预测精度分别达到81.7%和81.2%.