基于标签传播和深度游走模型的社区发现算法

来源 :武汉大学 | 被引量 : 0次 | 上传用户:suibiannicheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社区发现是社会网络研究的重要课题,主流社区发现算法主要分为基于模块度优化的方法、基于谱分析的模型、基于信息论的算法和基于标签传播的方法。其中,基于标签传播的算法效率较高,但精度不够。因此针对标签传播算法的不足,本文提出一种基于深度游走的改进算法,更好地实现社区发现的功能。在真实网络数据集和合成网络数据集上的实验表明,改进的算法在准确性方面有显著提升。本文的主要工作和创新点如下:(1)本文的创新在于使用深度游走模型对网络中的节点进行训练。基于这个思想,通过深度随机游走的方式对网络中的节点进行采样得到随机序列,并在此基础上使用SkipGram模型对这些样本进行训练。通过层次Softmax的方式对SkipGram模型进行求解,最终得到改进的邻接矩阵。(2)不同于传统标签传播算法给所有节点进行标签分配的初始化过程,改进方法在迭代开始之前,通过节点影响力进行种子集合选取,目的是为了有选择地给部分节点进行标签分配。(3)改进的算法通过标签的加权和作为标签选择的依据。通过改进的邻接矩阵中存储的节点相似度,可以得到标签的加权和,以此作为标签传播概率的权重因子进行标签的传播迭代。本文在6个真实网络数据集和3种规模的合成数据集上进行实验,对比传统标签传播算法、CNM算法和LPAp算法的社区发现结果,表明改进标签传播算法具有更高的准确率,尤其对于节点个数在100以上的真实网络,模块度Q值的提高达到10%以上。
其他文献
随着我国农业产业结构的不断调整,休闲农业迎来了新的发展机遇,兼具农业生产与休闲旅游等多种功能的休闲农业园作为其主要发展载体,在缩小城乡差距、推动美丽乡村建设等方面具有重要作用。休闲农业园不断被赋予新的内涵其类型也逐渐多样化,对滨水沙地休闲农业园的规划设计理念与方法进行系统的研究具有理论意义与实践参考价值。本文在以文献资料查阅和实地调研进行研究的前提下,结合相关学科理论如生态发展理论、园林学理论、植
航空发动机测试时的进气条件包括均匀流场和非均匀流场,其中按一定梯度分布的速度型是一种典型的进气条件。本文基于金属丝网的同目数网叠加和不同目数网拼接两种组合方式,在
通过数值方法对大迎角细长体湍流流场的模拟,研究头部顶端极小扰动对细长体非对称绕流形成与发展的影响,探讨可压缩流动中的涡流非对称性.结果表明,在细长体顶端附近施加极小
中期票据自2008年4月推出以来发行规模增长迅猛,2012年的中期票据发行规模就已经达到了 8,453.30亿元人民币,超过了同期企业债的发行量,2014年发行规模更是超过了 9,500亿元
需求跟踪作为软件过程管理中的一个重要环节,在保障系统质量、应对需求变更方面发挥着重要作用。利用需求跟踪,软件工程师可以发现制品之间的依赖关系、评估需求覆盖率和计算
宜居美丽社区的建设是美丽城市生态文明建设的重要内容和组成部分,是贯彻落实十八大以来党中央提出的推进生态文明美丽城市建设的必然形势和要求。进一步加强体大颐清园宜居美丽社区建设,对于促进经济社会和谐稳定、创新建设于基层的社会环境治理等都有非常大意义。近年来,中国人民政府加快和推进国内各省宜居美丽社区的建设,社区环境治理工作已经取得明显成效,但存在的一些问题也慢慢地暴露出来。由于当前我国大部分地区城市社
为了建设创新型国家,增强我国在国际舞台上的竞争力,缩小与世界发达国家的差距,我国高校每年都需要培养数以百万计的各类优秀人才充实到国家各条战线,而培养造就一批着眼于未
LH11-1油藏是我国第一个发现的大型强底水块状生物礁灰岩油藏,油藏的原油地质储量十分丰富。开采初期,油田主要的开发方式为水驱,进入开发中后期以后,由于礁灰岩油藏储层地质
随着经济蓬勃发展和互联网技术的日益成熟,大数据在人们的社会生活中发挥着愈来愈关键的作用。当今人们的生活消费观念发生了较大变化,消费信贷在整体信贷中所占的比重也在不断提高。大数据时代信息迅速扩张,很多问题逐渐涌现,如消费贷款平台风险控制能力不足,欺诈、坏账层出不穷等。做好大数据背景下的个人信用风险评估工作显得尤为重要。目前,很多学者已经意识到了新形势下建立个人信用风险评估指标体系的重要性,并积极开展
针对航天器从近地停泊轨道转移到近月停泊轨道的低耗能转移问题,研究了几种低耗能地-月转移轨道的设计思想和方法,包括:射向弱稳定边界并能被月球弹道式捕获的低耗能转移、基