面向主题的社交网络测量与分析

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:xyw1h
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网技术高度发展的今天,人们的生活方式已经跟互联网紧密结合。社交网络作为互联网在这一阶段的产物,满足了人们不同的在线社交需求。当前主流的社交网络有以信息分享为主的真人社交平台Facebook和人人网、以关注机制为基础的实时短信息广播社交平台Twitter和Weibo,以问答为主要互动方式的平台Quora和知乎、以及各类即时通讯应用,比如微信和Line等等。已有的研究表明,社交网络可以反映群众关注的热点和态度倾向,因此社交网络是舆情分析的重要对象。另一方面,社交网络是信息传播的绝佳载体,借助于用户间复杂紧密的连接关系,信息可以呈现爆炸式的传播,如果不对信息加以监控和引导,容易引发网络群体事件。社交网络的测量是上述研究的基础。社交网络的测量与分析是指通过采集、整理社交网络的原始数据,利用网络、社会网络和数据挖掘的理论方法和技术,挖掘和提取社交网络的结构特征和用户行为特性。社交网络的测量有助于了解网络的特征和变化规律,为舆情分析和监控提供理论基础。  当前,社交网络的测量主要集中在对整体网络的测量,忽视了内容的相关性和动态性。因此,本文针对社交网络开展面向主题的测量,主要工作和贡献包括:  1)在数据获取方面,针对当前面向主题的社交网络数据采集的采集数据少、召回率低等问题,提出将内置搜索引擎和通用搜索引擎相结合的主题消息采集方法,并将LDA模型应用到主题关键词的抽取,实现采集过程中主题的更新,同时还提出了一种基于用户生存值的高效采集扩展策略。  2)在测量方面,选取了三个主题,在两个社交网络上实现了主题网络的构建并测量了结构特征参数,包括出入度分布、同配性、出入度相关性和聚集系数等等。同时以七天为一个周期,对主题网络演化过程中参数的变化规律进行了研究。另外,针对主题消息数据,测量了主题消息极性以及主题热点变化。  3)通过测量发现:(1)主题网络具有明显的无标度性和小世界特性,大部分主题网络具有异配性;(2)主题网络的演化过程中,新节点主要由大V节点引入;(3)周期性主题在不同周期形成的主题网络在演化过程中结构参数的变化具有明显的一致性;(4)主题的性质对主题网络演化过程中参数变化的强度有明显的影响;(5)主题消息极性和其被转发的概率有一定的关联,受主题性质的影响较大;(6)利用主题关键词描述热点的方法可以有效测量出主题热点的变化情况。  综上,通过对面向主题的社交网络的测量和分析,我们发现了主题网络的结构特征和演化规律,这对指导后续的社交网络的设计与建设、深入进行相关研究如话题发现和传播、关键人物社区的发现和跟踪等都有重要的参考价值和意义。
其他文献
我国是一个地质灾害频发的国家,每年地质灾害给国民经济和人们生活带来的创伤是难以计数的。地质灾难不仅给民众的生活安定带来了严重的影响,更严重的牵涉到国家的重大经济决
学位
耦合器是地球系统模式重要组成部分,用于连接各个分量模式。中科院地球系统模式CAS-ESM中使用的CPL耦合器在增加新类型的分量模式、添加耦合物理量、设置耦合频率等环节需要对
现代信息化社会,数据呈现爆炸式增长。这会带来三个方面的严重问题,即存储和管理数据的成本越来越高,数据备份和恢复的时间越来越长,以及数据中心的能耗越来越严重。重复数据删除
体光照技术在可视化和影视特效中有着广泛的应用。不同于一般的体绘制,体光照算法是一种计算体数据全局光照的技术,能够模拟光在体数据中真实散射的情况。通过该技术可以模拟基
物体分割是许多计算机视觉和图像处理问题的重要处理步骤,应用在物体识别、场景理解、图像编辑等相关任务中。因此,物体分割具有重要的研究价值和意义。物体类别的类内多样性,同
倒排索引是Web搜索引擎的核心数据结构,也是目前为止被认为最高效的大规模文本索引方法。随着互联网络的发展,数据规模和用户数量相比早期都有了质的飞跃,这给Web搜索引擎的性能
虽然人脸识别技术现已广泛应用到许多场景中,比如安全监控、辅助相机聚焦等,但人脸识别技术仍然面临着许多挑战。其中一个实际应用中经常会遇到的问题是:训练与目标的人脸图像
大数据时代所处理的数据规模、时效性、复杂度以及价值挖掘,对大数据存储与管理系统的扩展性、访问性能、可用性及可靠性都有着极高的要求。近年来,面向大数据的非关系型存储与
现代大规模并行系统除了被广泛应用于传统的高性能计算领域外,还开始用于新兴的云计算领域。通过对近年来高性能计算体系结构和云计算体系结构发展的调研,发现系统互连是构成上