论文部分内容阅读
目前基于病历的疾病特征提取方法有很多,但是这些方法存在病历数据离散化程度高、描述语言标准不统一、疾病特征的提取困难等问题。鉴于此,提出一种基于LDA模型的疾病特征识别方法。该方法能同时建模病历、疾病、特征三者之间的关系,得出病历-疾病和疾病-特征两个分布矩阵,从而达到疾病特征识别的目的。实验表明该方法的疾病特征识别准确率高于ID3算法和C4.5算法,达到了良好的疾病特征识别效果。