【摘 要】
:
聚类算法是数据挖掘、模式识别等方向的重要研究内容之一,被广泛应用于各个行业的数据分析和处理。多年来,研究学者针对不同应用需求,提出了各种聚类算法,这些算法各有长处,
论文部分内容阅读
聚类算法是数据挖掘、模式识别等方向的重要研究内容之一,被广泛应用于各个行业的数据分析和处理。多年来,研究学者针对不同应用需求,提出了各种聚类算法,这些算法各有长处,也各有其局限性。论文的主要任务是研究K-Means,PAM,DBSCAN这三个常用算法,针对各自缺陷提出改进方案,并利用多个数据集对改进前后算法进行测试对比,评价改进效果。论文完成的主要工作包括以下几个方面:论文研究并实现了K-Means聚类算法的改进方法,针对K-Means聚类算法的分类效果不稳定,对初始中心点的依赖性高的缺陷,设计实现了基于最小生成树的K-Means改进算法,构建最小生成树并剪断距离最大的6)-1个枝后,计算得到的6)个簇的中心点作为K-Means聚类的初始中心点。经实验验证,算法稳定性有了较大提高;论文研究并实现了PAM聚类算法的改进方法,针对PAM算法在遍历整个数据集,交换中心点和重新计算距离上造成的时间复杂度过高的缺点,设计实现了一个存储最近距离的PAM改进算法。通过存储每个非中心点的最近距离简化更新聚类的过程,经实验验证,改进后的算法在同一数据集上速度明显快于PAM算法;论文研究并实现了DBSCAN聚类算法的改进方法,针对DBSCAN算法在多种密度分布的数据集上分类能力较差的缺点,设计实现了多参数和合并邻近簇的改进算法。在VDBSCAN聚类结果的基础上,对距离较小的簇进行合并。经实验验证,改进后的DBSCAN算法既保持了对不同密度分布的簇的识别能力,又提高了准确率。论文研究并改进了K-Means聚类算法在硬件上的实现,实验首先通过软硬件协作实现了K-Means算法,经实验验证,改进后的算法在速度提高的同时,对资源的占用也大幅提升。之后,实验针对K-Means算法在距离计算上消耗过多的时间,采用了基于6)-(9树的聚类算法来减少距离计算的次数。实验对算法中硬件无法支持的部分进行了改写和调整,并依据硬件特性进行优化。经实验验证,改进方法能够有效提高算法运行速度,同时避免了资源占有过高的问题。
其他文献
玫瑰石顾问公司董事谢国忠日前表示,A股从去年12月进入熊市,大盘从6000多点下跌到2800多点,大部分股票已见底。他表示,熊牛转换并非一蹴而就,中国股市的熊市之路还要走一段时间。
中职学校在会计教学中不同程度地存在重理论、轻实践操作的现象,使得毕业生动手能力差,这种传统的会计教学难以满足市场对会计人才的需要。面对日益激烈的就业压力,如何提高学生
目的探讨住院精神病患者自杀行为临床特点及护理对策.方法:回顾性分析住院精神病患者42 例发生自杀行为的临床资料,分析其相关因素.结果:住院精神病患者自杀行为的发生与病种、
目的:观察综合护理在重度老年性痴呆伴精神障碍患者护理中的应用效果。方法:选取住院的34例重度老年性痴呆患者,通过简易精神状态检查量表(MMSE)测评、巴氏指数(barthel)评定量表、
本文是对《英语等式句与对等句》一文的进一步理论探讨。文章从结构语义学方法论着手,论证了以下两个观点:1.对等句中的论元与谓词在逻辑上虽不等值,在话语中却被认定为等值。在
2017年6月,民政部、财政部、国务院扶贫办联合印发了《关于支持社会工作专业力量参与脱贫攻坚的指导意见》,明确提出了支持实施社会工作专业力量参与脱贫攻坚重点项目。各地在精准扶贫工作中引入了社会工作。为了了解社会工作参与精准扶贫工作的政策在实践中所取得的效果,分析其存在的问题,为推动社会工作参与精准扶贫提供对策建议,本文在社会系统理论视角下,探讨社会工作参与基层精准扶贫的政策失灵原因,分析各个子系统
目的研究双歧杆菌三联活菌胶囊联合西咪替丁治疗坏死性小肠结肠炎(necrotizing enterocolitis,NEC)早产儿的疗效及对降钙素原(procalcitonin,PCT)和C反应蛋白(C-reactive pro
非谓语动词是专升本英语考试中的高频语法,考查形式灵活多样,知识点零碎,既是考查的重点,也是考查的难点。通过对非谓语动词考点的归类和分析,旨在帮助学生理清头绪,在做非谓语动词
随着各高校的不断扩招,我国高等教育快步地走向了大众化。在这种改革"精英式教育"而实行"大众化教育"的同时,伴随而来了生源质量大幅度下滑,不安于学习而混文凭的、缺乏学习积极
<正> 笔者以葶苈子单用或加入应证方剂中治疗青光眼、高眼压症5例,收到满意疗效。用法:体质壮实者葶苈子每日10g,加水煎成30ml煎液,分2~3次温服,体虚者在辨证施治方剂中加葶苈