基于受力分析的社区发现算法的研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:kassi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,社交网络蓬勃发展,网络的结构越来越复杂,基于社交网络的移动互联网应用越来越多。社交网络结构中的稠密子模块,代表了用户的群体。研究网络中的社区,有助于理解网络中的网络结构和网络的功能。而通过分析社区特征,有助于发现用户群体的需求,指导移动互联网应用提供精准的服务。由于服务的质量需求的提升,对社区质量和效率的要求也越来越高。对于中小规模的网络,模块度系列算法等由于考虑的特征不足,造成找到的社区的质量不高;MCL等算法没有抓住社交网络的稀疏性的特点,造成了算法的效率偏低。对于超大规模的社交网络,现有的局部社区发现算法,发现的社区包含无关子图,降低了局部社区的质量。因此,基于全局社区和局部社区存在的问题,本文做了两方面的工作。本文针对基于边关系的全局社区发现算法找到的社区质量不足、发现社区效率偏低等问题。首先提出了节点力的模型,量化了节点之间的相互影响。参考经典受力分析模型,给出了节点之间直接影响和间接影响的组合办法,得到了节点力的受力分析模型。接着,本文设计并实现了 Edge Pruning算法。算法的核心思想是每一轮迭代的时候,逐步删除最有可能的社区之间的连接边。由于受力分析模型考虑了节点之间的间接影响,使得模型更接近真实社交网络的情况,因而降低了误删的概率;Edge Pruning逐步删边的策略,逼近了真实社区的结构;此外,算法引入了局部特征,通过预筛选的机制,在降低误删的概率的同时,也减少了每一轮迭代的计算量。真实数据集和基准数据集上的实验表明,Edge Pruning算法在提高了发现社区的质量的同时,还降低了运行的时间。其次,针对现有的局部社区发现算法结果存在无关子图的问题,本文设计并实现了局部社区发现算法LCDFA。论文首先基于受力分析的模型,判别出强连边,根据贪心的思想,将强连接的节点归入同一个社区,设计并实现了子算法LFA。接着,LCDFA让LFA和Heat Kernel这两个子算法从两个不同的角度去发现同一个社区。然后,将这两个子算法的结果对所有的节点进行投票,得票数为两票的节点为最终的局部社区。真实数据集和基准数据集上的实验表明,LCDFA通过投票的办法,限制无关子图的大小,减少无关子图的影响,提高了局部社区的质量。
其他文献
铅卤钙钛矿及其太阳电池是目前新材料和新能源研究领域中最热门和最前沿的研究方向之一。探索研究实现高质量的钙钛矿晶体薄膜与更高效率、更加稳定、更低成本的钙钛矿太阳电
作为激光干涉测量的长度标尺和溯源基准,激光波长(频率)的准确度决定了干涉测量系统所能达到的最高相对测量准确度,因此激光稳频技术研究一直是精密和超精密激光干涉测量领域关
随着现有无线频谱资源越来越不能满足人们日益增长的数据传输速度的需求,人们不得不开发新的技术提高频段的频谱利用率。全双工无线通信就是提高频段利用率的一种有效的方法,
内蒙古阿巴嘎旗白音希勒地区位于二连—贺根山蛇绿岩带北侧,处于锡林浩特微板块与南戈壁微板块之间的晚古生代弧—弧碰撞造山带。古生代属古亚洲洋构造域。中新生代属滨太平
传统的光纤传感技术已经在过去几十年吸引了巨大的关注并在很多领域得到了极大的应用,这归功于其优良的抗干扰特性、小巧简洁、耐高温高压以及高灵敏度的特点。另一方面,磁流
近年来,在石油勘探应用领域,所获取的地表图像数据量正在飞速增长,为了研究与分析这些“巨大”的图像数据资源,需要依赖高效的图像处理技术。然而,传统基于内存的图像处理方
过去四十年来,随着全球金融市场迅猛发展,金融市场波动性也显著加剧,金融风险管理受到广泛关注。而随着我国金融改革的进行,中国股市市值居全球第二,成为全球重要的股票市场
在石油勘探中,主要有地震勘探与测井勘探,地震数据在时间域分辨率较低,范围广,而测井数据在深度域分辨率较高,但是范围窄,二者数据都存在各自局限性,因此,测井、地震数据融合
时间序列的预测研究是数据分析领域的重要内容,通过整合事物随时间变化的数据信息,并对时间序列进行建模分析,可以探索事物的发展趋势与发展规律,并对数据变化进行预测。多元
节能是中国制造2025强国战略的基本理念,面对日益严峻的环境问题,国内外都在探索一条高效的绿色制造体系。工程机械作为基础建设的重要工具,其主要的传动方式是液力传动,但面