复杂网络社团结构数学建模及挖掘

来源 :重庆大学 | 被引量 : 0次 | 上传用户:cc_7722
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂网络理论作为研究复杂系统的重要工具得到了各领域学者的广泛关注。它以网络的形式对各类复杂系统进行最本质的抽象,为我们提供了一个研究这些系统的结构特性和动力学特性的跨学科平台。社团结构挖掘是复杂网络研究中的重要内容。已有研究表明,社团结构对复杂网络的特性具有重要的影响,挖掘网络的社团结构对相关理论研究具有重要的意义。此外,挖掘网络的社团结构还可以对复杂网络进行不同尺度地简化,帮助我们理解系统的结构和相应模块的功能。在工程领域中,社团挖掘作为网络聚类技术也具有重要的应用价值。  由于网络的社团结构过于复杂,在社团结构的定义、评判准则、挖掘算法等方面仍有许多问题没有解决。鉴于此,本文系统地研究了复杂网络社团结构的定义、数学模型、评判准则以及全局社团和局部社团的挖掘方法。  社团结构的形成是网络中的节点根据它们之间的联系强度进行自组织的结果。从该角度可知社团内每个节点的内部联系强度大于或等于该节点与其它任意一个社团的联系强度,该特征体现了社团边界的封闭性,可称为社团的边界特征。本文基于该特征推导出了社团结构的一个约束条件(diff值),该约束条件能够较准确地识别社团的边界,并能识别出那些划分错误的节点,是一个比较有效的社团挖掘评判准则。此外,社团结构还具备一个内部特征,即社团内部节点的平均相似度大于社团之间节点的平均相似度。边界特征反映了社团结构的自组织特性和边界的封闭性,内部特征反映了社团内部的节点平均来说联系更紧密。基于这两个特征,本文对现有的社团结构定义进行了改进,并基于定义建立了社团结构的数学模型,同时给出了一种具有线性时间复杂度的近似求解算法。  研究表明模块度Q值存在分辨率问题(欠分割),同时又存在过分割问题。这说明从最大化内部连边的角度研究社团挖掘评价准则可能存在误差。本文从相似度的角度,提出了一种密度对比割模型(Density Comparative Cut,DC-Cut)。分析表明,该图割准则受社团规模和形状的影响较小,其性能较稳定,社团挖掘结果也具有较好的可解释性。在DC-Cut的基础上,提出了一种社团挖掘评价准则S值,并建立了相应的社团结构优化模型。通过遗传算法对模型进行求解,并在多个基准图上进行测试,表明评价准则S值和优化模型具有较高的精度。  提出了一种快速的全局社团挖掘算法框架,将无权无向网络、加权网络和有向网络的社团挖掘问题统一到了同一个框架中。算法框架基于层次聚类的思想,首先通过节点相似度模型对网络进行初始化,将网络预处理为小规模的初始节点簇,在此基础上采用本文的簇相似度模型对这些初始节点簇进一步聚类,并根据评价准则S值选择最优的社团划分。在预处理阶段和节点簇聚类的过程中,借助于一个三元组和两个数学公式,使算法的效率得到较大幅度地提高,整个过程的时间复杂度仅为O(n2)。理论分析以及在各种无权、加权和有向基准图上的测试结果表明该方法性能较高,要优于现有的主流方法,如CNM算法和谱聚类算法等。  针对现有的局部社团挖掘算法存在精度和稳定性欠佳、对起始节点位置敏感等问题,提出了一种思路新颖的“内外夹推”算法(Shell Interception and Core Expansion,SICE)。算法首先利用本文推导出的“基于累积k步单向型随机游走的节点相似度模型”得到核心子图和邻居子图,并采用“一次一个子图”的方式扩展核心子图。该方式很好地解决了以往算法的一个缺陷(以往算法采用“一次一个节点”的方式容易受周围邻居子图的影响,导致节点误划分)。此外,在核心子图“外推”的过程中,邻居子图则对核心子图“内夹”,该方式可使SICE算法摆脱缺乏网络全局信息的困扰,能够识别出完整的社团结构,使算法具有较高的精度和稳定性(这里说的稳定性主要指从社团内任何一个节点出发,都能返回稳定准确的结果)。另外,这种“内外夹推”的机制还可以使SICE算法具备识别重叠社团的能力。理论分析以及实验表明SICE算法要明显好于当前的同类算法,其性能接近主流的全局社团挖掘算法。  文章最后对相关工作以及取得的成果进行了总结,并进一步指出了未来的研究方向。
其他文献
PS版的需求量增多,使得PS版的整体稳定性和整体质量难以保证。为了取得优良的印刷效果,市场对于版面质量提出了较高的要求,且以此参数,评估PS版的整体品质。人工目测一直是国
随着能源的日益短缺,利用可再生能源供电成为了行之有效且十分必要的方法,而微电网便是将可再生能源进行利用的一种非常有效的形式。微电网中,为了让微电网经济高效地运行,每个DG(Distributed Generation)输出的有功功率与无功功率是两项非常重要的指标,实际应用中线路阻抗常常会影响负载容量的均分,不适合的均分负载容量的方式可能会导致承担较大功率输出的DG老化程度急剧加快,从而给微电网的稳
学位
胎儿心电监护一直是产程中胎儿健康监护的重要手段。目前常用的采集方法为母亲腹壁心电采集法,该方法采集到的是胎儿心电、母亲心电、工频干扰、基线漂移、肌电干扰以及一些其
近年来,随着综合电力系统的快速发展,对船舶电站的要求越来越高,为了满足全电力推进船的电力性能的稳定性及可靠性要求,一种新型的配电网络的拓补结构——环形区域配电网络逐
据统计,空调能耗占建筑总能耗65%,中央空调是大厦里的耗电大户,因此中央空调的节能改造显得尤为重要。中央空调作为制造产业,其节能效果亦关乎人类长远利益,我国是空调消费大国,节能
眼压信号是青光眼患者特别是重症青光眼患者需要实时、准确监测的一项非常重要的生理信号。目前医院常用的眼压测量仪器,由于其尺寸大,无法连续监测且需要外人协助测量等因素
时间序列挖掘是数据挖掘领域中最具挑战性的十大研究方向之一。时间序列流是一种连续、高速、无限、时变的按照时间排列的有序序列。连续性要求挖掘算法扫描次数少;高速性要求
永磁同步电机伺服系统在半导体制造、高精度数控机床、工业机器人等许多领域有着广泛的应用。但永磁同步电机是一个非线性、强耦合的对象,在复杂的工业过程中还存在许多不确定
随着汽车的逐渐普及,城市交通安全和路口通行效率等问题目益突出。如何抑制交通事故的上升趋势,成为当今智能交通系统的主要研究方向。机器视觉技术的进步加速了智能系统的研
近年来,超声波煤气表在人们的日常生活中得到了越来越广泛的应用。超声波煤气表属于一种超声波气体流量计。它的研究,无论是对于自动化测量技术的提高还是对于满足人们生活需要