论文部分内容阅读
一个复杂的真实系统可以通过简单的网络结构来描述,所以我们可以通过研究网络的结构来分析系统的性质。这里就涉及到如何得到网络的结构与如何去分析网络结构问题。因此本文将对网络结构的重构、预测与挖掘进行研究,具体内容为:(1)在已知动力学过程情况下,本文提出了一个基于平均场近似的极大似然估计方法(MM)的理论框架,可以针对离散的动力学时间序列完全重构网络。该框架主要包括三个步骤:第一步根据动力学过程建立似然函数;第二步利用平均场近似的极大似然估计方法求解相关动力学参数;第三步再利用平均场近似的极大似然估计方法把网络重构问题转化成求解线性方程组问题,即通过求解线性方程组可以得到每个节点的连边情况,从而获得网络的全部结构。然后通过在生成网络与真实网络上的实验表明我们的方法的可靠性与有效性。(2)本文还通过平均场近似的极大似然估计方法解决了多层网络的重构问题,并通过实验分析了网络结构、动力学参数以及噪音对网络重构的影响。(3)在未知动力学过程情况下,通过期望最大化算法(EM),本文提出了一套基于统计推断的理论框架,可以从离散的二值动力学时间序列中重构每个节点的邻居情况。然后通过真实网络与生成网络上的实验验证本文方法的可靠性与有效性。该方法不需要有关于动力学的任何先验知识,不需要参数,而且在噪音的情况下依然可以很好的重构网络。(4)在没有时间序列,只知道节点终态信息的情况下,本文提出了一个基于极大似然估计的框架重构每个节点的邻居情况。该方法可以从各种二进制终态信息(有没有收到谣言、有没有感染疾病等)中重构网络,而且当我们增加信息量(信号接收时间,或疾病感染时间),该方法还可以进一步提高网络重构精度。接着,本文还给出了两个定理以此来提高了网络重构的性能。最后,通过对网络重构受随机扰动影响的分析,利用分组预测来提高算法的鲁棒性。(5)在网络结构的预测方面,通过对不同的网络结构分析,发现不同的网络具有不同的结构特征,而且同一网络内的不同模块也有可能存在不同的特征。因此,在本文中我们定义了一个可以结合多种特征的逻辑回归函数,然后通过已知结构学习不同特征的权重,以此预测网络未知结构的连边概率。最后,实验验证该方法要优于其他链路预测的相似性指标。(6)在网络结构的挖掘方面,本文主要对网络的核边(core-periphery)结构进行探测。首先提出了一个基于三元模体的核边结构的探测方法。该方法主要分为三个步骤:第一步根据节点和边的属性定义三元模体;第二步得到网络的模体矩阵;第三步通过求解模体矩阵的最小电导率寻找最优类别以此实现核边结构的划分。这个方法可以探测网络不同类型的核边结构:单核边结构和多核边结构或局部核边结构和全局的核边结构。(7)本文还分析了经典的随机块模型在处理核边结构与社团结构探测问题上的不足,即推断中BP算法的近似在处理核边结构中存在严重的不合理性。因此,本文在没有增加任何计算复杂度的基础上对算法进行了修正。最后在社团结构与核边结构的探测问题上验证了修正后的BP算法的结果,发现在稀疏的社团结构上,修正后的BP算法与经典BP算法具有同样的性质,在稠密的社团结构以及核边结构中,修正后的BP算法会表现得更好与更稳定。