基于MapReduce和并行遗传算法的大数据聚类问题研究

来源 :鲁东大学学报(自然科学版) | 被引量 : 0次 | 上传用户:zheng829
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是将不同对象的集合分割为由相似对象组成的多个不同类的过程,是最重要的数据挖掘技术之一.然而,对于大数据聚类却是一个复杂的问题.由于大数据体量庞大,聚类算法时间消耗巨大.并行是解决算力不足的一个非常好的方法.据此,本文采用了Hadoop平台上的MapReduce来实现大规模数据集的并行运算,将大数据聚类问题的时间复杂度限制到一个可以接受的范围内.最后本文从时间消耗和聚类精确度方面对该方法的性能收益进行了评估,在保证较高精确度的同时大大提高了运算速度.
其他文献
由福建省科协与南平市人民政府联合举办,南平市科协、科委承办,三明、龙岩、宁德三地(市)科协协办的“首届福建山区论坛”暨“福建农业与农村经济发展”科技月谈会经过半年多的筹
"活性"/可控自由基聚合(CRP)具有精密调控聚合物的组成和结构的重要特征.有机磷化学与生命息息相关,已经成为聚合反应一类重要分支.随着研究的深入,其中有机磷类化合物也可在CRP
为探讨心电图对右室梗塞(RVI)的诊断价值,我们对18例左室梗塞合并RVI的患者描记了右胸导联V<sub>3</sub>R~V<sub>7</sub>R及双极右胸导联CR3R~CR7R的心电图,同时设对照组20例。梗
广西铁道学会成立于1978年12月,挂靠柳州铁道局,设有运输、经济管理、牵引动力等22个专业委员会(分会)和学术、科学技术普及两个工作委员会.秘书处为学会办事机构.学会主办<
研究了测度链上的二阶边值问题,解决了换元积分和格林函数对称形式构造中的困难,运用迭代技巧,得到了对称正解存在的充要条件,并举例验证了结果.
1 临床资料 患者男,67岁。突发心前区压榨性剧痛4小时,于1995年4月19日入院。感心悸头晕,出大汗,无恶心呕吐,无发热。查体:T37℃,P88次/min,BP17/9kPa。意识清楚。双肺未闻及
1999年初由中国电信总局和国家有关部委的信息主管部门共同倡议发起的"政府上网工程"在我国引发了一场规模空前的政府信息化普及活动,大大提高了各级政府部门的信息化意识,有
颈椎病可引起“心绞痛”样症状及心电图异常改变,国内已有报道,但颈椎病的类型与心电图异常的相关性报道少见。本文回顾性分析了1991~1998年门诊与住院颈椎病患者22例,均有不
【正】 近年来,多渠道、多层次、多形式的横向经济联合发展很快,这对我国经济体制改革和现代化建设,将会产生深远的影响。但由于横向经济联合是经济生活中的一件新生事物,未
心电图运动试验是诊断和鉴别冠心病的一个有价值的非侵入性手段。多年来,ST段移位被认为是运动诱发心肌缺血的有力证明,并一直作为运动试验阳性