论文部分内容阅读
目的:构建了一种从科研文献提取关键信息建立化学知识库的流程。方法:使用名称转化技术和光学结构识别软件提取化合物结构,使用文献管理软件EndNote X8获取文献题录信息,使用机器学习工具ChemDataExtractor和人工注释方法提取文献内信息,使用计算模拟平台Pipeline Pilot 7.5获取可预测属性,关联开源数据库ChEMBL获取已知生物活性。结果:成功建立起一种合理、高效的化学知识库构建策略,并采用该策略构建了北京大学海洋天然产物库PKU-MNPD。结论:提出了一种化学知识库的数据汇聚策