半监督自训练算法在乳腺癌分析预测中的应用研究

来源 :重庆师范大学 | 被引量 : 1次 | 上传用户:wuxing2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来罹患乳腺癌的女性数量大幅增加,乳腺癌已成为全世界女性最常见的癌症,其死亡率仅次于肺癌。目前为止,早期诊断发现从而遏制乳腺癌的发展仍然是乳腺癌治疗的基础。伴随着人工智能领域的不断发展,利用机器学习的方法对乳腺癌医学数据进行归纳分析,探索规则,建立乳腺癌智能诊断系统已成为医疗卫生领域的研究热点。目前,建立乳腺癌智能诊断系统仍存在许多问题:首先,研究人员往往能搜集到大量的疑似乳腺癌样本,而能够确诊肿瘤良恶性的有标记样本往往需要专家花费大量时间会诊得出。智能诊断系统往往因为有标记样本的不足,导致模型分类精度不高,泛化性较差。其次,研究人员手中大量的无标记样本没有得到充分利用,如何选择出有价值的无标记样本加入训练尚具有盲目性。最后,原始的乳腺癌数据往往存在属性关联冗余的问题,不利于直接进行建模预测,研究人员也同时鲜有对乳腺癌原始医学数据进行具体的归纳整理分析。为解决上述乳腺癌智能诊断系统建立中存在的问题,充分发掘乳腺癌医学数据的价值,建成分类精度高,泛化性较强的诊断系统。本文所做的工作如下:(1)将半监督自训练方法应用在乳腺癌智能诊断中,提出了一种结合密度峰值优化模糊聚类的半监督自训练方法。该方法先对无标记样本集进行密度峰值聚类,在人工地选出聚类中心后,将新的聚类中心作为模糊聚类的初始聚类中心进行模糊聚类,从而筛选出有价值的无标记样本。实验结果表明,该方法与结合其他聚类算法的自训练方法相比分类精度有所提高。(2)对美国威斯康辛大学医院的乳腺癌数据进行了数据分析处理。通过数据可视化的方法与数据进行交互,将特征属性冗杂的乳腺癌数据进行归纳整理,筛选出决定肿瘤良恶性的关键特征属性,为探索乳腺癌的病因病理和乳腺癌早期的排查诊断提供了重要的检测方向。(3)利用改进的自训练方法对经过预处理的乳腺癌数据进行分类预测,建立了一种基于半监督学习的乳腺癌智能诊断系统。该系统能在初始有标记数据较少的情况下,通过迭代自训练,分类精度不断提高,泛化性不断加强,为乳腺癌的智能诊断提供了新的思路,促进了智能医疗的发展。
其他文献
通过介绍动态轨道衡软件系统的工作原理和软件的编写工作,说明用微机来实行过程控制的实用性和准确性。从而进一步探讨用微机进行电子汽车衡数据监控的可能性。
采用差示扫描量热法(DSC)研究了在超临界CO2作用下,温度、压力和共溶剂对双酚A型聚碳酸酯(BAPC)的结晶和熔融行为的影响。结果表明,超临界CO2能使双酚A型聚碳酸酯(BAPC)在其玻璃化转
目的:探讨综合干预对美沙酮维持治疗者6个月后的效果试点工作的成效。方法:对重庆市渝北区美沙酮维持治疗门诊于2006年9月-2010年6月收治的吸毒患者进行治疗前和治疗6个月后的
雷达目标的高分辨距离像具有稀疏和可压缩的特点,可以在频域进行稀疏非均匀采样获得目标的宽带散射数据,再通过恰当的信号处理手段得到一维高分辨像.本文描述了基于频域稀疏非均
目的分析研讨循证护理在急性胰腺炎保守治疗中的作用。方法随机从我院2016年3月至2018年12月收治的急性胰腺炎患者中抽取140例进行讨论,用随机数字法分组,其中70例接受常规护
5月以来,海南儋州、澄迈、临高、海口等市县冬瓜出现大面积滞销。据了解,目前海南仍有12万多t冬瓜等待销售,其中儋州9万t、海口2万t、澄迈1.6万t。
期刊
所有权和经营权可不可以分离?应不成该分离?这个问题极为再要,它关系到“政企分开”、“承包制”、“租赁制”等经营责任制得以顺利进行的理论基础,也是当前深化经济体制改革、增
利用FLUENT软件UDF及动网格技术,研究了弹簧劲度系数对单向阀开启过程影响,结果表明:开启过程中第一次往复振荡幅度相对较大,第二次往复振荡后阀芯位置几乎稳定;弹簧劲度系数
目的探讨口服超声造影剂在胃十二指肠疾病早期的诊断价值。方法2015年1月至2017年1月该院收治的同时接受口服超声造影和胃镜检查的消化道疾病患者626例,以胃镜病理检查为金标
建设工程索赔通常是指在工程承包合同履行过程中,合同当事人一方因对方不履行或未能正确履行既定的义务,或者由于对方的行为使权利人受到损失时,要求对方补偿损失的权利。各