基于Fiedler向量的复杂网络重叠社团挖掘算法研究

被引量 : 0次 | 上传用户:ylmny
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂网络普遍呈现出社团结构特征。直观上,这意味着复杂网络可能包含一些局部结构模块(即社团),使得每个模块内部联系紧密且与外部联系较为松散。每个节点仅归属于一个社团的社团结构为非重叠社团结构,反之为重叠社团结构。发现社团结构对理解复杂网络的结构和行为、预测其演化都是非常重要的,并且有很强的应用前景。社团挖掘技术的研究已经成为社交网络分析、数据挖掘、信息检索等领域日益关注的焦点。  复杂网络发展十多年来,非重叠社团结构的研究十分活跃,代表性成果有Newman提出用以度量社团结构的模块度概念以及一系列基于模块度优化的社团挖掘方法。由于复杂网络呈现重叠社团结构通常更符合客观实际,近年来人们把非重叠社团结构的模块度概念和相应的社团挖掘方法进行推广用来处理重叠社团结构问题。这其中有一类方法称作谱聚类方法,其基本思路是首先计算网络拓扑图的特定图矩阵的若干个特征向量,然后用FCM等方法来发现重叠社团结构。谱聚类方法有明显的局限性:需要计算多个特征向量、时间复杂度高;使用定量方法描述节点的社团归属问题等。  针对谱聚类方法的局限性,本文对重叠社团挖掘的谱方法作了进一步探索研究,提出了基于Fiedler向量的重叠社团挖掘算法,主要工作包括两个部分。  一、基于网络拓扑图的Laplace矩阵的Fiedler向量的物理意义和Fiedler向量划分图的合理性,提出了仅计算一个特征向量即Fiedler向量的重叠社团挖掘算法(FVOC算法)。对于事先设定的社团个数k,该算法首先对Fiedler向量用k-means方法将图中节点粗略划分成k个非重叠社团,然后采用一种模糊化策略来确定每个节点的社团归属问题。相比于传统谱聚类算法需要计算多个特征向量的情形,我们的重叠社团挖掘算法是高效的。测试算例验证了该算法的准确性。  二、我们的重叠社团挖掘算法需要事先设定社团个数k,但通常复杂网络中社团个数事先并不清楚。针对这种情况,本文设计了一种启发式策略来快速地确定社团划分的合理个数。基于该策略的重叠社团挖掘算法能适用于复杂网络社团个数未事先确定的一般情形。测试算例验证了一般情形下该策略的有效性。
其他文献
光学显微镜有着一个共同的缺陷:放大倍数越大,其景深越小。在生物医学或者刑侦领域使用的光学显微镜,其景深的数量级通常是10-3m或者更小,这就造成了一个现象:当被观察的物体表
网格计算是科学计算领域的热点问题,其目的是将地理位置上分布各地的各种计算资源、存储资源汇聚起来,实现资源的共享和协同操作。网格内部资源的高效利用关键的因素在于用户提
随着知识工程的快速发展以及石油行业数字化的推进,用知识的方式管理油气勘探开发成果和相关文献逐渐成为数字化油田建设的重点。为了方便利用前人勘探开发经验,有效的管理和
如今大数据时代,数据的稀疏性问题日益严重,传统的单一协同过滤推荐算法很难保证较高的推荐精度。而社交网络的快速发展,使得更多类似于好友关系、标签内容的多元化信息可以融入
安卓操作系统自2008年首次发布以来已经进行了多次更新,然而,数次更新后碎裂开始显现,这使得更新所有先前版本操作系统难以及时实现。除了核心操作系统是开源的,谷歌拥有提高核心
随着互联网用户和数据的急剧增加,高通量计算(High Volume ThrougthputComputing)的需求越来越大,对高通量计算方面的研究也越来越多。高通量计算方面的研究需要海量真实的用
互联网时代,信息量飞速增加,网络用户数量也不断增长,人类正在通过信息技术将历史上曾经生产的种种媒介内容融入比特之海,同时以史无前例的速度继续生产内容。信息量的急速增加,一
随着人们生活水平的提高,汽车拥有量逐年提高,致使石油危机和大气污染越来越严重,得到了各国的高度重视。各研究机构80年代就开始对天然气、液化汽车进行深入研究和实验工作。近
无线传感器网络协议栈是一个较综合的研究领域,一方面涉及面向应用的理论研究和算法设计,另一方面需要考虑整体设计、与其他网络互联融合等工程问题。随着物联网等概念的提出,无
协同科研环境在线服务为科研人员提供云端的信息保存和分享服务,进行协作科研。科研信息和数据及相关知识产权的保护通常是科研人员非常关心的,云端数据隐私保护也是当前重要的