QSAR/QSPR模型验证方式与预测能力的关系研究

来源 :计算机与应用化学 | 被引量 : 0次 | 上传用户:zjtiankong1981
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
QSAR研究中,判断模型预测能力至关重要。长期以来,模型的预测能力是使用留一法或留k法等内部验证来确定,但在2004年形成的OECD规则中,已明确规定必须使用外部验证集去评价模型的预测能力。为了研究内部验证和外部验证与模型预测能力之间的关系,本文以45种睾酮和二氢睾酮衍生物以及37种萘锟酯衍生物为研究对象,以E-Dragon计算的分子描述符作为自变量,在增n减l算法选择变量的基础上,采用SVM算法对同种物质的不同活性以及不同物质的不同活性建立QSAR模型,研究QSAR/QSPR建模时的不同验证方式与模型预测能力的关系。研究结果表明,模型的预测能力与内部验证结果的好坏无必然联系,而结合外部验证的检验结果则是判断模型预测能力的可靠依据。 In the QSAR study, it is important to judge the ability of the model to predict. For a long time, the predictive ability of the model was determined by internal verification such as leave-one-leave or leave-one-k methods. However, in the OECD rules formed in 2004, it has been explicitly stipulated that an external verification set must be used to evaluate the predictive power of the model. In order to study the relationship between internal and external validation and model predictive power, 45 testosterone and dihydrotestosterone derivatives and 37 naphthalocyanine derivatives were studied in this paper. The molecular descriptors calculated by E-Dragon Based on the variables selected by the n-subtraction algorithm, the SVM algorithm was used to establish the QSAR model for the different activities of the same substances and the different activities of different substances, and to study the different verification methods and predictive ability of QSAR / QSPR modeling relationship. The results show that the predictive ability of the model is not necessarily related to the quality of the internal verification results, but the test results based on the external verification are reliable bases for judging the prediction ability of the model.
其他文献
士官任职培训是为适应岗位逐级晋升需要而进行的教育培训,具有明确的目的性、鲜明的针对性和突出的实践性。与目前我军其他院校的士官任职教育一样,部队俱乐部主任任职培训也
对比分析东天山土屋铜矿成矿时的大地构造条件及与之伴生的火山岩岩石组合和沉积建造,认为该矿床在泥盆纪至石炭纪中期形成于古亚洲洋北部边缘岛弧带的古地理环境。用偏度(Sk)和峰度(Ku)对成矿物质Cu、Au、Ag、Mo等在矿体和不含矿岩体中的含量分布状态进行检验,结果表明该矿床在漫长的形成过程中由来自洋壳重熔岩浆+复杂成因气液流体的矿质多次叠加而成。综合分析成矿后矿区及周边地区发育的沉积岩岩性、岩相和所
利用春夏季(3~8月)12个站降水资料以及冬季(12~02月)温度资料,通过统计方法选取新疆南部地区温度异常年份与春夏季降水异常年份,并进行相关分析,结果表明:暖冬年份对应的来年春夏季总降水量偏多;反之,冷冬年对应的春夏季降水总量偏少。再利用NCEP/NCAR1960-2000年全球月平均网格点资料分析500 hPa高度场环流特征,结果表明:暖冬年前期环流特征为西低东高型,冷冬年前期环流特征为西高
本文在均匀弹性全空间中对走滑断层附近方向性速度脉冲作了定性研究。研究表明,方向性速度脉冲主要与观测点和破裂起始点之间的一部分破裂面的破裂过程有关;方向性速度脉冲的周期随震源时间函数中的上升时间增大而增加。破裂速度对于方向性速度脉冲的峰值和周期有重要影响,一般而言,随着破裂速度的增加,方向性速度脉冲的周期减少,峰值增大。因此在统计脉冲的峰值和周期与矩震级的关系时,需要考虑破裂速度的影响。
随着海军使命任务的拓展,远海卫勤保障任务日益繁重,海上卫勤建设需要与建设强大的海军目标相适应,形成完整的近、远海多种形式逐行卫勤保障系统,为完成战争和非战争等多样化
在普林斯顿海洋模式(POM)数值模型的基础上加入了漫滩格式,通过对胶州湾1个月实测潮位资料的调和分析,选取了5个较大的分潮,首次对胶州湾进行了多分潮的潮位和潮流数值模拟,
鱼雷是水面舰艇面临的主要威胁之一,如何有效地防御鱼雷攻击已经成为各国海军必须认真面对的问题.认真研究国外鱼雷的现状和发展趋势,有助于研制出高性能的水面舰艇鱼雷防御
目的 探讨参加第二十九届北京奥运会安全保卫工作军人(以下简称"安保军人")的心理健康与职业压力及相关因素的关系.方法 采用随机整群取样法,使用和(MDPSS)对631名安保军人(
应用T-RFLP(末端限制性片段长度多态性)技术分析和比较了胜利油田单12区块的一口注水井(S12-zhu)和三口采油井(S12-4、S12-5和S12-19)的油藏微生物多样性.基于T-RFLP图谱的多
在金伯利岩人工重砂中发现的“熔离小球”,直径多数