基于交互关系的网络社区影响力分析方法

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:poco666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的蓬勃发展使距离不再成为人们认识彼此、交流信息的障碍,基于地域、爱好和理想等多种元素交汇的网络社区逐渐成为人们更加方便地获取信息的手段。虚拟的网络社区延续并大大拓展了实体社区的概念,使得信息流通和传递的速度越来越快,范围也越来越广。影响是伴随着人们交流之间自然而然产生的一种作用,这种作用能够感染、控制或者操作一些人或事,使受作用的对象改变想法或者做出决策,进而使得人群形成某种一致化的行为。社会影响力分析是社会计算研究中非常重要的一部分,其研究的就是社会人群中一致化行为的形成机理和发展规律。传统的社会影响力分析大多从社会心理学、认知学和营销学等学科入手,融合统计调查,取得了一些基本的结论,这些结论在传统的市场营销、广告投放、公共决策等领域显示着巨大的价值。随着近年来虚拟网络社区的快速发展,传统的领域亟待互联网的改造甚至是颠覆,以社交网络崛起为代表的病毒式营销、网络口碑传播等成功案例也越来越多,以网络社区为对象的社会影响力分析越来越成为网络挖掘和社会计算的研究热点和重要方向。  本文主要关注网络数据处理和社会计算,特别集中于网络社区中潜在影响力的发现和影响传播规律的分析。网络社区的影响伴随着社交用户的交互关系而产生,交互的媒介有很多种,本文以网络社区中的文本交互为例,对于社交网络中交互数据的高度碎片化、噪声大、语义不全等问题。不同于网络挖掘和知识工程中构建领域知识库的传统做法,本文提倡从数据中学习,充分认识文本数据的多样性,并结合网络社区自身的结构特点,重点研究了网络社区中用户交互文本的结构和内容的融合策略,试图回答网络社区中基于文本交互的用户之间是如何影响,以及怎样影响的问题。另一方面,本文对于社会网络的最基本的二元关系网络中的信任预测问题也提出了一种简单而有效的策略,策略的原型来源于社会学的一些结论,信任问题是影响传播的基石,同样在解决网络社区用户之间是如何影响以及怎样影响这一基本问题。在本文的最后,提出了一种可人工干预的影响力最大化模型,并分析了其对影响力传播的作用,试图回答影响力传播广度的问题。具体说来,论文的主要工作如下:  1)提出了一种基于时间关联排序的统一融合框架并将其运用于网络社区中交互文本帖子的影响排序。该框架的目的是将交互文本的语义信息融合进网络社区的结构中,其基本思路是建立交互文本的不同语义尺度的表示,并根据网络社区中领域知识的一致性,学习出不同语义尺度下的语义质量,在不同语义尺度下根据语义相似性重建出语义树,相应的提取时间关联模型下的排序值;然后通过语义质量融合不同尺度下的时间关联排序值。如果网络结构是显性给出的,那么语义和结构的融合也可以在时间关联的排序模型下进行。  2)提出了一种基于社交元数据聚类的多任务学习方法并将其运用于网络社区交互文本帖子的影响预测。该方法的目的是将网络社区的结构信息作为交互文本的上下文,通过对社交元数据的建模和划分,自然而然地形成聚类的多任务,通过先分后学的策略,结合聚类多任务学习算法处理网络社区数据学习方法所面临的两大问题,要么是网络社区数据所在的空间维度过高,统一学习的代价太大,容易造成过拟合;要么由于学习的子任务过多造成每一个任务的学习样本不足,彼此之间又缺乏联系造成的欠学习问题。其根本原因还是由于网络交互文本的碎片化、语义不全等问题。本文试图在二者之前找到一个折中的策略。  3)提出了一种二元社交网络关系中信任预测的方法。该方法引入了社会学中人们交往的一些基本逻辑,旨在解决影响传播过程中的信任预测这一基本问题。该方法将社交推荐中的矩阵分解方法应用到信任预测中,在影响的建模过程中综合考虑三方面的因素,一是自己的社交偏好,二是与自己邻接的用户的社交偏好,最后我们还对邻接的用户的邻接节点的偏好也考虑在内,将这三方面的因素融入基于社交网络的矩阵分解中,取得了较为满意的效果。  4)提出了可人工干预网络影响力的最大化问题能并给出了基本的近似求解算法。传统的影响力最大化问题不考虑网络结构的改变,通过对候选节点的选择和依赖一定的传播模型近似处理网络影响力传播的最大化问题,而实际的网络处于不断变动之中,我们根据现实中可干预网络结构变化的情况下,扩展了传统的影响力最大化问题,并给出了一些基本的近似求解算法。
其他文献
侧信道攻击的出现打破了传统黑盒密码模型对攻击者能力的约束。传统黑盒模型中,攻击者只能获得密码设备的输入和输出;而在侧信道攻击模型中,攻击者还可以获得关于密码设备运
随着图像采集设备的快速发展,通过互联网共享的图像日益增多,图像数据动辄以TB计。需要有效地管理在线和离线的图像资料库。所以区分不同类别的图像是一项重要的工作。在计算
随着计算机三维可视化技术的发展,计算机辅助的三维颅面复原技术成为研究热点。颅面复原是对未知的人类颅骨进行面貌复原的技术,该技术主要用三维可视化技术对三维数据进行数
高分辨率的海量地形数据能够反映地形表面网格的细节特征,在军事环境模拟和地质灾害(如地震、泥石流)等研究领域有着重要的分析和监测应用。因为海量地形对应于地形表面均匀
距离变换是计算图像中每个点到最近的特征点的距离,将原本无意义的孤立的特征点表示为特征点与背景点的距离关系。距离变换对图像作出了更为丰富的表达,后续方法可以根据需要
随着普适计算的发展,上下文感知作为普适计算的核心部分,越来越得到大家的关注。上下文感知研究的是如何获取上下文、上下文的表示、以及上下文的推理等,其目的是为了利用上
数字图像处理系统在大图像处理性能与数据展示效果方面具有一定的缺陷,综合考虑系统本身的GIS背景以及GIS技术面向海量数据的特性,本文拟通过引入GIS技术来弥补这些缺陷。经
随着手写文字识别技术的快速发展,阿拉伯语文字分类已日益引起研究者的关注。有两种阿拉伯语文字识别系统:联机和脱机文字识别。对于联机文字识别系统,需要使用特殊的数字化
随着Web2.0的兴起,软件开发正在转变传统的服务观念,个性化业务大量涌现。然而移动性差、硬件成本高、资源扩展性差等问题制约了第三方业务开发的发展。而云计算恰恰在实现服
随着Internet的流行和发展,人们对于Internet的依赖也越来越强,对Web应用也有了更多的需求。传统Web应用的客户端主要是用来渲染服务端返回的HTML页面,功能单一,难以满足用户的交