论文部分内容阅读
随着社会的快速发展,生活质量的不断提高,人们对于健康的重视程度日益加深,中医作为中华国粹,越来越受到人们的青睐。以中医诊断为主题的中医远程诊断产品不断涌现,但是现有的中医舌诊系统获取病人症状信息的能力有限,影响了诊断效果。随着大数据时代的到来,人工智能技术的不断成熟,计算机技术的不断提高使得中医领域与计算机技术融合成为了必然,中医药知识图谱能良好的集成中医领域知识,被计算机理解和应用。基于知识图谱的舌像诊疗系统能够根据用户输入的症状和上传的舌像照片模拟中医诊断流程给出中医辩证结果以及建议使用的药物。本文对中医药知识图谱的构建进行了深入研究,初步构建了一个中医药知识图谱,并将其应用于舌诊系统中,主要研究内容如下:首先,借助本体的概念,构建中医知识图谱的模式层。在设计构建模式层时,参考了国内的“中医药学语言系统”的语义类型和中医专业知识,确定了知识图谱的基本类型、属性和关系,形成了中医药知识图谱概念模型。其次,使用自然语言处理技术构建中医药知识图谱的数据层。通过处理和整合不同数据源(原有中医药知识库、中医病症疗效诊断标准、百度百科、电子病历)完成实体识别、属性抽取、关系抽取以及知识融合等环节。在实体识别环节,利用CRF对电子病历进行命名实体识别,使用CRF++工具对电子病历中的实体进行抽取,利用爬虫技术实现属性抽取,基于规则模板和机器学习模型Att-Bi LSTM实现关系抽取,并采用基于属性向量的实体对齐方法进行不同数据源的知识融合,然后利用Neo4j工具构建了一个中医药知识图谱。最后,对基于知识图谱的舌诊系统进行设计实现。使用Spring Boot完成了系统框架的搭建,并利用Spring Data Neo4j和Spring Data JPA连接Neo4j和My SQL两种数据源,在舌像诊断环节根据用户输入的症状和舌诊结果实现中医辨证,最后给出建议用药和注意事项,完成整个诊断过程。为了评估系统使用效果,选用了100个用户进行测试,测试结果发现系统一方面可以实现基于知识图谱的舌像诊断,另一方面在舌诊辨证的过程中与传统的关系型数据库相比速度有明显的提升,尤其跨多重关系查询时速度提升更加显著。