论文部分内容阅读
二十一世纪是复杂性的世纪。作为研究复杂性科学和复杂系统的有力工具,复杂网络为研究复杂性提供了全新的视角。广泛的应用前景使得复杂网络的研究倍受国内外的密切关注,引起了不同学科的高度重视,已成为近年来的研究热点。复杂网络是指将系统内部的各个元素抽象成为节点,元素之间的关系视为连接的边,而构成的一个具有复杂连接关系的网络。在过去的十年里,学者们对复杂网络结构特性的研究逐步深入,从最早的网络的拓扑性质研究开始,提出了节点或边的中心度量与节点间的距离度量,并揭示出现实世界中的复杂网络所具有的部分独特的统计结构特征,如:“无标度”特性、“小世界”特性以及高聚集系数等。社会网络系指由社会个体指代节点,个体间的关联作为边形成的网络,在线社会网络系指将互联网的在线社会媒体中抽取出的实体作为节点,实体间的关联作为边形成的网络,这两类网络的研究在复杂网络研究领域获得了很多学者的关注。本论文主要对社会网络的节点影响力、节点角色,以及在线社会网络研究中话题和社会节点关联演化等问题进行了研究和探讨。分析社会网络中的节点影响力以及节点角色,进而找出社会网络中的关键节点具有很大的实用价值和现实意义。使用社会网络分析技术对在线社会媒体数据进行分析,能够发现网络用户的各种行为模式,为更多创新性的Web应用提供支持。本论文的主要研究内容如下:1.提出了新的影响力传播模型。论文将连续时间马尔可夫链(Continuous-Time Markov Chain, CTMC)引入经典的独立级联模型([CM),从而给出了一个改进的ICM模型,本文称之为CTMC-ICM模型。通过该模型可以得到对σ(A)的较精确的估计值,即在给定节点集合A时,能够被集合A影响到的节点数量的估计2.基于随机游走的理论,考虑到不同节点可具有不同的传播能力,本文提出了一个新的节点影响力度量算法,称为SpreadRank度量算法。不同于过去的基于随机游走理论的中心度度量,SpreadRank将节点的传播能力引入转移矩阵函数。实验结果表明它比基于距离的中心度量方法效率更高,并且新的排序算法能够从所有节点中提取出具有影响力的节点集,通过激活这个影响力节点集合,可以将信息最大化地在网络中进行传播。3.论文对节点的角色划分进行了分析,结合了复杂网络结构的关系属性以及节点个体属性信息,提出了一种融入结构属性的新的社会网络分析(SNA)算法。这种算法有两个优点:角色划分时考虑了节点间的关系,便于考察节点在整体中的价值;划分时使用的是网络的全局信息,而非网络的静态局部信息,使得分析的视角更为全面。论文以电信通话网络为例进行分析,将用户划分为不同的角色,有利于运营商根据不同角色用户的行为特征制定营销策略。4.论文提出了一种基于社团结构的二维的PageRank度量方法,两个维度分别称为InnerRank和OutterRank,并给出了根据这两种度量划分网络中的节点角色的算法。InnerRank用于指代节点在社团内部影响力的高低,OutterRank用于指代节点在社团外部影响力的高低。根据这两个影响力度量,可将网络的节点划分成为四种角色。这种角色划分方法对有向网络、无向网络、加权网络、无权网络均可适用。作者通过对现实数据的实验验证了方法的有效性,实验结果表明在上述四种网络中均可根据这种方法分析出节点的角色。5.论文以在线论坛为例,对在线社会网络数据进行了话题检测分析。通过文本语义分析,在论坛帖子间的语义关系形成后,我们将在线论坛的社会网络数据构建形成时序论坛关系图。本文的研究中,话题检测问题被视为复杂网络分析中的图聚类问题。作者采用复杂网络分析方法对论坛关系图进行聚类,聚类结果即为在线社会网络中的话题。6.对在线论坛进行话题检测分析后,论文基于信息熵中互信息量的概念,提出了在不同时间间隔下,在线社会网络中话题之间的关联演化分析算法。我们考虑了对应话题的两种影响因素:语义相似性以及社会实体节点的关联性。此外,论文还定义了一个异质论坛关系图结构,该网络包含了论坛中的语义信息和作者间的发表一回复信息。根据社会实体节点对关联话题的演化影响程度,我们对社会个体节点的影响力进行排序,得到了该在线网络的舆论领袖列表。总体而言,本论文针对复杂社会网络的社会实体节点性质相关的诸多重要方面进行了研究。具体来说,本文的创新性主要体现在如下四个方面:1.扩展了经典的影响力传播模型,提出了新的节点影响力度量算法。新的度量算法能够有效地提高分析结果的准确率和运行效率。2.以电信通话网络为例,采用融入结构属性的社会网络分析(SNA)新方法,提出了基于节点结构属性的节点角色划分算法。该算法能够有效地利用网络的全局信息对电信通话网络中的用户角色进行分析。由于电信通话网络是典型的社会网络,该方法也能够推广到一般的社会网络中。3.提出了一种基于社团结构的二维的PageRank度量方法,两个维度分别称为InnerRank和OutterRank,以及根据这个二维度量以划分网络中的节点角色的算法。根据这两个影响力度量维度,可将网络的节点划分为四种角色。这种新的节点角色划分方法能够适用于有权、无权、有向、无向等各种社会网络。4.分析了以在线论坛为代表的在线社会网络。对应话题的两种影响因素一语义相似性以及社会实体节点的关联性,我们提出了新的话题关联演化的分析算法,并根据社会实体节点对关联话题的演化影响程度,分析发现了推动舆论演进的重要作者(舆论领袖)。