基于数据挖掘的社团划分算法研究与实现

来源 :北京邮电大学 | 被引量 : 4次 | 上传用户:coolwater_3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的快速发展,网络社团研究逐渐成为了热点问题。网络社团划分对深入理解网络拓扑结构和进一步挖掘网络特性具有重要意义。近年来提出的标签传播算法,具有简单高效、不受模块度分辨率限制等特点,是目前最快的社团划分算法之一,在大规模稀疏网络中得到了广泛应用。然而,标签传播算法也存在一些不足。在其划分结果中,可能出现极大规模的社团,即所谓的“怪物”社团问题。此外,标签传播算法挖掘重叠社团能力有限,不能有效发现网络中的重叠社团特征。本论文在标签传播算法基础上做出进一步改进,力图解决“怪物”社团问题和重叠社团挖掘能力较低的问题。针对标签传播算法的“怪物”社团问题,本论文提出了Booming-LPA(Booming-Label Propagation Algorithm)算法。研究发现,衰减IPA(Label Propagation Algorithm)算法标签传播过程中的社团激增现象是出现“怪物”社团的重要原因。基于社团激增现象,Booming-LPA及时停止算法迭代,有效避免了“怪物”社团的出现,提高了挖掘社团的质量,并降低了算法的时间复杂度。实验表明,Booming-LPA算法挖掘的社团是衰减LPA算法挖掘结果的子社团,具有很高的准确率。针对标签传播算法挖掘重叠社团能力较低的问题,本论文提出了AOLPA(Attenuated Overlapping Label Propagation Algorithm)算法。在COPRA(Community Overlap Propagation Algorithm)算法基础上,AOLPA算法通过在模型中加入衰减因子使其快速收敛,通过重构重叠社团挖掘模型避免标签被过早去除,进而增强了重叠社团挖掘能力。实验表明,AOLPA算法在算法的时间复杂度、空间复杂度和重叠社团挖掘能力方面均有较大改进。
其他文献
本文分析了现有承载网络的问题以及下一代承载网的发展趋势,指出现有的IP网络在QoS、网络业务安全性等方面还有很大的不足,是无法达到电信级业务的要求。然后总结介绍了现有主
首先,本文简单介绍了GPS的发展过程、GPS的系统组成、GPS的信号结构以及GPS信号的捕获原理,详细阐述了GPS信号现有的几种C/A码捕获方法,并在比较各种捕获方法的基础上,选用一种伪
论文开展了对VXI总线中频信号源模块相关技术的研究,并将研究成果应用于某型PCB自动测试诊断系统。论文详细讨论了VXI总线技术、直接数字频率合成技术和宽带信号源稳幅技术,给
随着目前移动计算,音视频处理,无线宽带等技术的不断进步,DSP在越来越多的数据处理场合扮演着重要角色。本文基于一款16位定点DSP指令集系统的分析和实现工作,对DSP处理器的指令
随着计算机技术及互联网技术的飞速发展,越来越多的企业通过Web系统来开展自己的日常工作。在构建Web系统的技术中,传统的C/S结构逐渐表现出局限性。目前,基于B/S结构的多层分布
褐飞虱腹部脂肪体内普遍存在类酵母共生菌,该类共生菌在褐飞虱的生理代谢和营养利用等方面意义重大。试验采用冷冻切片技术结合显微摄像系统观察法开展褐飞虱体内共生菌的个体
硫氧还蛋白过氧化物酶(Peroxiredoxin,简称Prx)是一类新发现的抗氧化酶,广泛存在于原核和真核生物体内。真菌在有氧代谢过程中,抗氧化酶在除去氧自由基保护生物体中发挥重要的作
自由空间光通信(FSO)又称大气光通信,自20世纪90年代以来已经成为光通信领域的一个研究热点。相比于传统的光纤通信,自由空间光通信最大的特点是使光信号脱离了光纤的束缚,可
人体活动分析在人机交互、人工智能、安全监控、智慧医疗等领域具有广阔的应用前景,其目标在于自动感知用户活动以提供个性化的智能服务。自动识别休克、摔倒等危险活动并及时
在过去的几年中,VoIP以其低廉的话费,巨大的应用优势赢得了市I的青睐,成为目前世界上发展最快的应用技术之一。 H.323和SIP是目前VoIP领域使用最广泛的两种协议。其中SIP与In