基于Spark的无线城市社团发现算法研究

来源 :辽宁工程技术大学 | 被引量 : 0次 | 上传用户:yydfan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统的社团发现算法存在生成结果冗余、复杂度高、大量迭代计算、没有考虑地理位置信息等问题,提出一种改进的社团发现算法SIACD(on Spark use Improved Apriori to achieve Community Detection algorithm),通过改进关联规则算法在Spark集群上挖掘无线城市中的社团数据。首先,为解决传统的社团发现算法未考虑地理位置信息的问题,SIACD算法选用无线城市中MAC地址数据,并将该数据映射到布尔矩阵中进行数据预处理。其次,为解决传统的社团发现算法复杂度高及大量迭代计算的问题,SIACD算法利用基于项数的布尔向量交运算改进Apriori算法,减少非关键计算。最后,SIACD算法利用Spark基于内存计算的特性,在Spark集群平台上实现该算法的并行化计算。实验结果表明,传统的社团发现算法及Apriori算法均不满足大数据时代对计算速度的要求,SIACD算法能有效挖掘社团成员的频繁项集,具备可扩展性及并行化性能,解决了生成结果冗余、复杂度高、迭代计算等问题,对大数据的处理能力和计算效率更好。SIACD算法性能优势明显,降低了计算时间,提升了社团发现的挖掘速度,提高了对社团数据的处理能力。该论文有图22幅,表9个,参考文献56篇。
其他文献
光电催化(PEC)分解水是太阳能转化为氢能最有前景的方法之一。而高活性和稳定性的光阳极材料决定了 PEC分解水过程中光能到氢能的效率。在众多的光阳极材料中,TiO2因其具有丰
近年来随着油气开发力度不断加大,重大安全事故时有发生,尤其是自“深水地平线”事件以来,油气井井筒完整性问题越来越受到重视,引起了国内外学者普遍关注。然而针对含硫气井
随着云计算、虚拟化等新兴业务在数据中心部署,数据中心内部发生着重大变化。随着网络规模的不断增长,传统树形网络拓扑结构暴露出扩展性差、部署成本高等缺点。为了克服传统
产业集聚作为一种经济地理现象,其集聚经济效应对城市内部和城市之间资本和劳动力配置具有重要影响。自改革开放以来,我国出现了大量城市群,主要以长三角、珠三角、京津冀三大城市群为代表。城市群大量涌现得益于产业集聚对资源的优化配置。已有研究表明,产业集聚的规模经济效应和范围经济效应能够改善城市间要素扭曲程度,提升城市间资源配置效率,强化区域协同效应。但是,当产业集聚发展到一定规模后,会出现产业过度集聚的问
在信息技术飞速发展的今天,阻变存储器因其密度高、容量大、速度快、功耗低的优势,成为下一代主流存储器的有力竞争者。从工艺和集成密度的角度考虑,无源交叉阵列是实现阻变存储器高密度存储的最佳方案,但是阵列中泄漏电流带来的串扰问题不容小觑。为此,研究者们提出了多种方案来解决串扰问题,其中,使用选通器(selector)与阻变存储器串联来抑制泄漏电流被认为是最经济的解决办法。表征选通器性能优劣的关键参数是非
随着社会经济和科学技术的不断发展,风机产品需求的数量和质量也随之提高。C企业是国内风机产品的重要组成部分--动叶轮产品的主要生产厂商之一,目前由于动叶轮行业的竞争越
高分散负载型纳米Au催化剂的可控制备,一直是纳米Au催化研究领域的难题;纳米金催化剂具有极高的CO催化氧化反应活性,但在反应中易失活,其催化反应机理及失活原因尚不明确。为
近年来,3D打印技术应用越来越广泛,而伴随的质量问题也越来越突出,因此国内外许多专家学者对此展开了广泛的研究。在增材制造领域中FDM型3D打印技术应用最为广泛,但当前FDM型3D打印加工出来的产品质量理学性能较差,很难实现在工业领域的应用,同时,由于FDM型3D打印机的工作时间较长,因此在打印过程中会遇到异常打印工况,现在市面上的打印机大都没有配备过程监测技术,这是增材制造领域面对的严峻问题之一,
随着一氧化碳(CO)首次被R.Heck的团队于1974年开发用作小分子插入单元应用于有机合成中,越来越多的有机小分子被开发作为结构单元应用于合成复杂的有机分子中。其中,以异腈类
J-自伴微分算子是一类非常重要且应用广泛的非自伴微分算子.近年来,随着非自伴微分算子理论知识的不断延伸,具有转移条件的微分算子问题激发了众多研究者的兴趣.本文主要围绕