论文部分内容阅读
现代社会由各种社交网络组成。由于其在人们的日常生活与商业活动中均扮演着重要角色,社交网络也因此成为了近年来国内外学术研究中的热门领域。根据个体间的亲密程度不同,社交网络可分为弱关系型网络与强关系型网络,其中弱关系型网络的覆盖范围更加广泛,用户参与目的更加明确,因而一般具有更高的研究价值。本文以弱关系型社交网络为主要研究对象,并从网络的结构特征出发,在现有研究成果的基础之上提出新的网络模型,该模型在网络链路预测、网络可视化、网络推荐算法等理论或应用领域均有重要价值。
一般来说,弱关系型网络具有链路互惠性、传递性以及个体度异质性、集群性等结构特征。本文以经典隐空间理论为基础,提出集群社交影响力效应扩展的隐空间网络模型。该模型利用欧氏距离的对称性巧妙引入了社交关系的互惠性和传递性,并通过社交影响因子调整欧氏距离以适应个体度异质性对链路概率的影响,使用混合多元正态分布拟合个体分布的集群性特征,从而较为完整地考虑了各种网络特征,并分析了不同特征之间可能存在的交互作用。此外,考虑到大规模社交网络中普遍存在的稀疏性特征,本文进一步将传统隐空间模型的正态分布假设扩展到更加广义的厚尾椭球分布族,以适应稀疏网络中个体分布的厚尾特征,并以混合多元t分布为例从理论和实证角度重点讨论。在参数估计方法上,本文基于贝叶斯统计思想建立了MCMC参数后验估计算法,并通过数值模拟方法对该算法进行检验。
本文基于两组开源的真实网络数据集对模型展开实证研究。第一组数据是美国某修道院的僧侣友情关系网络,本文将所提出的模型与现有网络模型进行对比,实验表明本模型在网络社区发现、链路预测以及网络可视化等方面均有优良表现,特别是混合多元t分布模型在拟合不同稀疏程度的网络中表现出更强的稳定性和可靠性。第二组数据是斯洛文尼亚的共享读者杂志网络,该网络为无向加权网络,本文使用泊松分布替换原模型的伯努利链路分布,以使模型适应加权网络,实验表明调整后的模型对该网络具有良好的拟合效果与社区发现功能。
一般来说,弱关系型网络具有链路互惠性、传递性以及个体度异质性、集群性等结构特征。本文以经典隐空间理论为基础,提出集群社交影响力效应扩展的隐空间网络模型。该模型利用欧氏距离的对称性巧妙引入了社交关系的互惠性和传递性,并通过社交影响因子调整欧氏距离以适应个体度异质性对链路概率的影响,使用混合多元正态分布拟合个体分布的集群性特征,从而较为完整地考虑了各种网络特征,并分析了不同特征之间可能存在的交互作用。此外,考虑到大规模社交网络中普遍存在的稀疏性特征,本文进一步将传统隐空间模型的正态分布假设扩展到更加广义的厚尾椭球分布族,以适应稀疏网络中个体分布的厚尾特征,并以混合多元t分布为例从理论和实证角度重点讨论。在参数估计方法上,本文基于贝叶斯统计思想建立了MCMC参数后验估计算法,并通过数值模拟方法对该算法进行检验。
本文基于两组开源的真实网络数据集对模型展开实证研究。第一组数据是美国某修道院的僧侣友情关系网络,本文将所提出的模型与现有网络模型进行对比,实验表明本模型在网络社区发现、链路预测以及网络可视化等方面均有优良表现,特别是混合多元t分布模型在拟合不同稀疏程度的网络中表现出更强的稳定性和可靠性。第二组数据是斯洛文尼亚的共享读者杂志网络,该网络为无向加权网络,本文使用泊松分布替换原模型的伯努利链路分布,以使模型适应加权网络,实验表明调整后的模型对该网络具有良好的拟合效果与社区发现功能。