论文部分内容阅读
电子病历(Electronic Medical Record,EMR)中蕴含了丰富的医疗经验和临床规律,为临床医生的科研工作提供了重要的数据资源。但临床科研医生由于缺乏相应的IT技能,访问电子病历的门槛较高,目前一般是在IT人员的帮助下,抽取所需病历,进而对其进行临床科研分析。 为了降低医生使用电子病历的门槛,本文提出了基于自然语言问题的电子病历分析工具—QReport,临床医生仅需要使用自然语言描述科研统计需求,并将其输入QReport,系统便能够自动地将相应的图表结果展示给医生。QReport的技术难点在于如何准确获取临床科研分析需求的语义,因为医生在描述需求时,表达形式多样,且描述中出现的医疗术语常与医生的描述习惯有关,非标准术语。 基于上述难点,本文构建了电子病历知识图谱,融合了EMR数据、医疗术语的层次关系、医疗术语的同义关系,以实现对问题中医疗术语的识别。在此基础上构建了基于电子病历知识图谱的统计类问题解析文法,实现对科研统计问题的解析。实验结果表明,该文法能够覆盖临床科研统计需求中78.2%的统计类问题模式,问题解析正确率为96.36%。