多模态跨平台社会事件分析技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:jeanstrouse
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社会事件是指发生在特定地点和特定时间的特定行为,它由许多随时间推移的子事件组成。随着互联网的快速发展,出现越来越多的社会媒体网站,用户可以非常方便地在这些网站上分享其想法、图片、帖子和其他相关活动。因此,当一个流行事件发生在我们周围时,它可以在不同社会媒体网站中快速地进行传播,同时会产生大量的多媒体数据。用户上传的大部分与事件相关的多媒体内容都与某些特定的话题相关,如果对这些数据进行人工识别和聚类来获得真实场景中事件的整个主题演变过程,将是非常耗时的。因此,一个社会事件分析的通用框架是非常重要和必要的,它能够及时地了解社会事件随时间演变的发展趋势。  然而,由于社会事件数据来自不同的网站,具有跨平台、多模态、大规模和噪声大等属性,进行社会事件分析的研究非常具有挑战性。本文的研究目标是设计一个通用的社会事件分析框架来解决上述几个问题,并针对社会事件表示、检测、跟踪和演变分析任务,构建一个有效鲁棒的社会事件分析框架。在提出的框架中,我们针对每个任务设计了具体的模型,详细来说,本文的主要贡献体现在如下5个方面:  1.社会事件表示的目的是从大量媒体数据中抽取有效的特征,得到语义层面的多模态事件表示。针对社会多媒体数据多模态和跨平台特性,我们提出一种基于非参数贝叶斯字典学习模型的多模态跨平台协同学习事件表示方法。该方法能够充分利用多模态跨平台的数据源,在事件表示过程中进行互相补充和互相促进。  2.社会事件检测的目的是从大规模的社会媒体数据自动地挖掘和识别有意义的社会事件。针对大规模社会媒体数据的监督属性,我们提出了一种新颖的提升多模态有监督潜在狄利克雷分布模型,该模型在boosting框架中引入有监督主题模型,能够适合大规模数据的分析。而且,提出的方法能够联合利用多媒体数据的多模态信息和监督信息,用于社会事件分析。  3.社会事件跟踪的目的是在时序性社会事件数据中跟踪多个社会事件。如何建模时序性多模态数据以及避免跟踪过程中模型漂移是事件跟踪过程中的两个难点。我们提出了一种新颖的在线多模态多专家学习方法来建模时序性多模态社会事件数据。而且,提出的方法采用了一种新颖的多专家最小化恢复方案,并允许模型剔除不满意的模型并更新当前最有效的模型,这样可以有效地解决跟踪模型漂移问题,提高跟踪精度。  4.社会事件演变分析的目的是从时序性多模态事件数据集来获得整个社会事件的演变过程,以及得到随时间推移的事件摘要细节。为了实现这个目标,我们提出了一种新颖的多模态事件主题模型,该模型可以高效地建模多模态媒体数据,并且可以区分视觉代表性主题和非视觉代表性主题。为了将该模型应用于社会事件演变分析中,本文采用一种新颖的增量学习策略,其可以随时间获得社会事件的时序性文本和视觉主题,从而帮助理解社会事件。  5.细粒度社会事件分析的目的是从多个社会媒体源进行社会事件的细粒度主题和观点挖掘。为了实现这个目标,我们提出了一种新颖的多模态多视角主题观点挖掘方法,该方法能够同时有效地考虑多模态属性和多视角属性来进行多个数据源的主题和观点学习。而且,该方法能够从所有数据源中发现多模态数据的共同主题,总结出每个特定主题的相似和不同之处,而且能在不同数据源学习的主题中自动挖掘多视角观点。
其他文献
本文基于粗糙集理论,以不完备信息系统为对象,研究基于粗糙集理论的不完备信息系统的知识获取的理论与方法以及相关应用。主要内容如下:  首先,介绍了粗糙集理论的发展和国际
近年来,随着社交媒体(微博、Twitter、Facebook等)深入发展和普及,人们越来越依赖于社交媒体分享个人经历、发表观点、表达意愿,并由此产生了海量用户生成内容。其中,交互意图广泛
涡街流量计是基于卡门涡街原理而研制的速度式流量测量仪表,自上世纪七、八十年代以来在我国得到了飞速发展和广泛应用。与传统的流量计相比,涡街流量计具有很多突出的优点。但
随着通信技术的高速发展,人们对通信业务的需求从最初的语音通话逐渐转换为更加复杂的混合业务(如音频、视频等),同时对服务质量(Quality ofService,QoS)的需求也不断提高。未来无
高超声速飞行器具备不低于5马赫的高超声速快速行进、远程响应时间短、机动性高、有效载荷高、可重复利用等优点,具备极高的军民应用前景。其中吸气式高超声速飞行器因可直接
无人车在越野环境中行驶,需要通过环境感知传感器对车辆周边的环境进行数据采集、处理,获得周边的障碍物特征及位置信息,确认可通行路径,从而为自主车的导航、规划及控制提供
人工神经元网络在软测量技术中被广泛的应用。软测量模型的建立是软测量技术的核心,人工神经元网络可以方便建立黑箱模型,从而实现对难测变量的估计。但对于工艺与时间紧密关联
发展高效节水型农业是国家的基本战略,连续自动获取农田水势信息是实践精细农业的重要基础之一,对发展高效节水农业意义重大。软测量技术主要用来预测那些传统检测方法无法获得
过程监测系统能够实时地监测生产过程,在保障工况平稳运行、改善产品质量及降低能耗等方面越来越发挥着不可替代的作用。大数据时代正在随着信息化程度不断发展以及硬件存储
本文综述了温度变送器的发展过程以及无线传感器网络的研究现状。通过对几种常用的无线传输技术的比较并结合本课题的应用需求,确定了以ZigBee无线传输协议作为本课题的无线传