基于谱聚类的慢性肝病超声检查报告文本挖掘算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:yjfu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
超声波检查是通过弱超声波仪器照射病灶,将病灶组织的反射波(echo)生成图像并处理,医生读取超声检查影像形成报告文本。超声检查影像受呼吸的干扰小,因此超声检查对慢性肝病的诊断准确率较高。近年来,我国慢性肝病患者不断增多,已积累了大量的超声检查报告文本。论文采用改进谱聚类算法,对具有高维数据特征的超声检查报告文本进行聚类分析,挖掘超声检查报告文本中潜在的价值,为慢性肝病的预测和诊断提供技术支持。主要工作如下:1.论文分析了谱聚类算法中聚类数难以确定,以至于聚类效率较低的特点,分别运用肘方法和轮廓系数法求得两个聚类数K值,作为确定聚类数取值区间。论文在搜狗新闻中文语料库上选取了12类1200条实际文本数据,验证了实际聚类数在论文计算所得取值区间内。论文比较研究了谱聚类和k-means算法的聚类效果,结果显示谱聚类算法得到的Rand指数比k-means算法提高了11.34%,Jaccard指数比k-means算法提高了14.67%;2.论文选择了110份真实慢性肝病患者的超声波检查报告文本,经过文本预处理后,运用上述算法。选定Calinsky准则为聚类的有效性指标,确定最优聚类数K值为5。论文制作高频词云图,分析得出了5种类型超声报告出现的高频词与诊断结果的关联关系,为提高慢性肝病超声检查诊断的准确率提供支持。论文对谱聚类算法进行了部分改进,提出了较为准确地定义聚类数的实现方法,通过实际慢性肝病超声检查报告应用样本,验证了论文改进算法的有效性,具有一定的实践应用价值。
其他文献
卫星日益用于预报虫害。 沙漠中的蝗虫,其数量猛增时,可能吞没从非洲的毛里塔里亚到印度之间的大片庄稼。最近的一次蝗灾发生在1988年。根据联合国粮农组织(FAO)的预测,另一
针对有线测量系统的布线纷繁复杂,系统容易老化,成本高,灵活性差,不具有可移动性的缺点进行了基于CC2480 IEEE 802.15.4/ZigBee片上解决方案和DS18B20数字温度传感器的无线温
随着我国城镇化速度加快,农村劳动力的减少,而西兰花收获几乎完全依赖人力,亟需推进西兰花的自动化收获。国内对于西兰花收获的相关研究很少,其自动化收割尚处于理论试验阶段
重点阐述了水飞蓟的用途、植物学特征,生物学特性,从选地、整地、播种、田间管理、病虫害防治、采收等方面介绍了水飞蓟栽培技术。
<正> 首先应当说明的是,这里所指的“未来坦克”是指2010~2020年间可能出现的坦克。因为2010年之前的新型坦克十有八九是现役主战坦克的改进提高型。本文拟从宏观上探讨新世纪
【正】 托马斯&#183;闵采尔是16世纪德国农民战争的杰出领袖。他提出了消灭私有财产、建立人间天国的政治纲领;并为实现这一纲领进行了英勇不屈的斗争,直至献出生命。因此,他
锅炉的使用有着十分悠久的发展历史,而且适用的范围也很广,从工业行业到生活行业都需要锅炉来提供相应的能量供给。但是不可否认的是,即使是在科技发达的今天,锅炉在使用中存
专访对象 :陶维林 (个人简介附后 )专访地点 :南京师范大学数学系数值计算实验室专访时间 :2 0 0 1年 3月 1 6日 1 4 :0 0~ 1 6 :0 0访谈目的 :如何看待基于《几何画板》的计
<正>通过构建系统树来揭示现存的生物类群间的亲缘关系,探索生物界的进化谱系(即系统发生)是进化生物学的一个重要领域.根据表型特征(主要是形态特征)的分析比较所构建的系统
会议
目的探讨新生儿缺氧缺血性脑病(HIE)血浆神经肽Y(NPY)、β-内啡肽(β-EP)的变化及纳络酮治疗后对其的影响.方法将34例中、重度HIE患儿随机分成常规治疗组(18例),纳络酮治疗组