论文部分内容阅读
社交网络依托于互联网的广泛应用,不仅拥有巨大的用户群体,还能够超越地理位置限制、时间限制和社会角色限制来拉近用户之间的距离,使得沟通成本更低、时效性更强,因此成为人们交友互动和获取信息的优选平台。社交网络中存在两类节点,一类是用户节点,该类节点通过影响他人体现重要性;一类是消息传播节点,该类节点由用户产生、通过扩散消息体现重要性。重要的用户节点和重要的消息传播节点有利于网络营销、舆论引导,本文对这两类节点的重要性计算方法展开研究,主要工作内容如下: (1)提出一种基于多关系网络的用户影响力计算方法。以新浪微博为例,首先分析了该社交网络中用户之间的交互行为特征,发现多种社交关系能够更全面地表示用户之间的影响;然后综合关注、转发、@三种关系度量用户之间的影响程度,再据此计算用户的全局影响力。实验结果表明,该方法能够结合用户之间的多种关系、有效刻画用户的影响力。 (2)提出一种基于场的消息传播节点重要性计算方法。通过分析实例数据发现,消息传播节点影响距离是有限的,并且消息传播节点对其后代节点的影响随着传播距离的增加而衰减;基于此结论,提出消息传播场来描述消息传播节点对其后代节点的影响,并结合拓扑和时间因素对该场中节点之间的影响进行度量;传播节点对其后代节点的影响之和作为该节点的重要性,称为源点中心性。实验证明,结合拓扑和时间因素的源点中心性能够从引发的传播数量、传播深度和传播速度三方面综合度量传播节点的重要性。 (3)设计并实现了一个基于新浪微博的消息传播分析系统。系统采用分布式采集和存储方案,能够分析关键消息传播节点、参与人群特征、情感倾向性、地域分布等多方面信息,以网页的形式面向用户。该系统可以扩展至具有类似消息传播特征的社会媒体平台。