论文部分内容阅读
肺系疾病影响患者的劳动能力和生活质量,随着疾病的进展,严重危害人类健康,给社会生产和经济带来巨大损失,也是医疗领域亟待解决的问题。随着医疗信息化的发展,医学数据日益增多,由于知识图谱能够将零散、琐碎的信息相连接实现知识整合,已成为各界共同关注的热点问题。构建医学领域知识图谱是从大量医学数据中挖掘知识,提取有效信息并对其进行重新组织和应用,对医学领域的发展具有重要意义。目前已存在较多关于知识图谱构建方法的研究工作,但普遍存在效率低、限制多、拓展性差的问题,同时缺乏针对肺系病的知识图谱构建与挖掘研究,针对上述问题,本论文探索了肺系病知识图谱的构建和挖掘方法,以支持肺系病的辅助诊断与预测任务。本论文主要工作如下:(1)提出了肺系病领域的知识图谱构建方法。肺系病知识图谱知识描述准确、层次清晰,能有效直观地展现出疾病症状间的关系,避免了不同数据源带来的异构问题,利用标注一致性对构建的肺系病知识图谱进行评价,证明了图谱的有效性,也为后续挖掘与预测任务提供支撑。(2)提出了一种面向肺系病知识图谱的链接预测方法(Link Prediction Method for Knowledge Graph of Pulmonary Diseases,LPP)。该方法首先把肺系病知识向量化表示,以三元组的形式送入门控循环单元神经网络中充分学习,同时引入注意力机制表示相关性,最终实现肺系病的预测。实验结果表明,将门控循环单元神经网络和注意力机制相结合的LPP方法效果显著,不仅提高了预测的准确率,而且提升了模型的稳定性。(3)提出了基于知识迁移的肺系病挖掘预测方法(Balanced Probability Distribution Algorithm Based on Feature and Instance Transfer,BPD)。该方法首先使用基于实例的级联迁移学习来获取接近目标域的实例,然后利用跨域特征过滤算法获得源域和目标域的共现特征。通过实例和共现特征实现多病源域向目标域的学习迁移,构建目标域的分类模型,使用弹性网络进一步提高模型的泛化性能。实验表明,BPD方法取得了目前最好的肺系病预测效果。