【摘 要】
:
利用医疗体检数据积累丰富且有价值的信息,可进行疾病的风险分析及个性化健康指导,预测受检者患上某种慢病的风险和概率,提醒受检者及时发现潜在疾病,为其提供健康指导及疾病
论文部分内容阅读
利用医疗体检数据积累丰富且有价值的信息,可进行疾病的风险分析及个性化健康指导,预测受检者患上某种慢病的风险和概率,提醒受检者及时发现潜在疾病,为其提供健康指导及疾病治疗措施。但原始体检数据存在信息模糊、有噪声、不完整和冗余的问题,无法直接用于疾病的风险评估与预测,因此对医疗体检数据进行预处理是很重要的。为了充分完成体检数据的预处理工作,本文在传统的预处理方法的基础上从多角度提出了针对体检数据预处理的有效方法:针对信息冗余的问题,提出基于压缩方法的体检数据归约,降低了体检数据预处理的时间及空间复杂度;针对体检项目不统一、异常值、重复值及缺失值较多的问题,提出基于相似重复记录和缺失值的体检数据清洗方法,完成了体检数据的清洗,解决了体检数据不一致的问题。通过删除元组、忽略不完整数据及填充技术完成基于缺失值的数据清洗;针对唯一标识码缺失的问题,提出基于线性函数的体检数据变换,实现了历年体检数据的连续性和规范性。在实现体检数据清洗时创新性的提出基于分词和权值的字段匹配算法完成相似重复记录的检测。体检数据预处理的目的是将不规范的数据转换为标准数据,实现医生术语、体检结论的标准化,纠正错误信息、填补空缺值。实验结果证明:基于压缩方法的体检数据归约可大大减少体检数据的不相关及冗余信息;基于分词和权值的字段匹配算法在召回率、正确率和F-测度值上分别高于传统算法6.23%、5.44%和5.84%,说明改进算法在检测相似重复记录上的准确性高于传统的算法;验证了经过基于线性函数的体检数据变换成功的给体检者添加唯一标识码。最后,开发了体检数据查询系统,实现了对预处理后体检数据的查询工作,将体检者的各项指标进行可视化展示。
其他文献
四川师范大学是四川省人民政府举办的全日制综合性省属重点大学,是四川省举办师范类本科专业最早、师范类院校中办学历史最为悠久的大学。学校位于四川省省会——成都市,现有狮
随着新时代教学理念的改变,小学数学教育的教学重点也发生了变化。通过对高中教育实践分析,发现在当下的数学课程中,教师对于培养学生的素质方面更加重视。所以为针对核心素质方
在任何阶段的教育工作中,我们教师的首要任务都应该是保障学生的生命安全,尤其是在小学阶段的教学中,由于小学生生活阅历浅,很容易受到各个方面的伤害,因此,在实际小学教育中,作为教
在小学教育过程当中,对学生口语交际能力的培养是一项十分重要的内容,现如今更是将其纳入到了教学目标当中。而学生的口语交际能力对于自身语文素养的培养具有着重要的影响,但在
据美国BIOCOMPARE科技新闻网(2008/10/28)报道,美国国家卫生研究院(the National Institutes of Health)的研究人员,发现了一个HIV突破屏障破坏人类CIMT细胞的作用机制,此研究发表于9
应《基础医学与临床》杂志编委、河南师范大学副校长徐存拴教授的邀请,《基础医学与临床》杂志的部分常务编委及编辑部工作人员一行20多人于2008年5月9日来到河南省新乡市,受到
血管新生参与机体重要的生理和病理过程。Vasohibin是新近发现的调节血管生成的内皮源性负反馈调节因子,对抑制血管生成起重要作用。Vasohibin因参与肿瘤﹑视网膜疾病及类风湿
目的研究Hes1、Hes5基因沉默对神经胶质瘤细胞U251增殖的影响。方法构建Hes1-shRNA和Hes5-shRNA慢病毒表达载体,分别干扰U251细胞Hes1、Hes5基因表达,用MTT、克隆形成实验和
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
目的探讨大电导钾通道(BK)对小鼠大脑皮层神经元胞内游离钙([Ca^2+]i)和兴奋性的调节作用。方法体外培养小鼠皮层神经元,用膜片钳技术观察BK特异性阻断剂iberiotoxin对神经元[Ca^2