基于社区挖掘的网络视频检索技术研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:alexander_guwen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着Web2.0技术的发展,以在线视频分享网站中的网络视频集为研究目标的网络视频检索技术逐渐成为研究的热点。由于网络视频内容丰富且质量参差不齐,传统的基于内容的视频检索方法无法达到理想的检索性能。在网络视频环境下,视频具有丰富而冗余的上下文信息,为视频检索带来了新的机遇和挑战。如何对网络视频集中多模态的上下文信息进行有效的建模和挖掘,实现基于上下文的检索是一个重要的研究问题。   针对这一问题,本文开展了基于社区挖掘的网络视频检索技术研究。社区结构是指网络中内部连接紧密外部相对稀疏的节点集合,是复杂网络中重要的拓扑属性。社区挖掘可以揭示网络的区域化特性,对于理解和分析网络结构具有重要的意义。而在网络视频检索中各种数据主体自然呈现复杂的多模态关联网络结构,从而为利用社区挖掘技术来辅助视频检索提供了用武之地。   本文研究旨在对网络视频环境下视频的多模态上下文信息进行形式化表示和关联网络建模,挖掘其中的社区结构,将蕴含于数据关联中的群体智慧应用于视频检索,帮助提高检索性能和提升用户检索体验。本文从视频上下文信息建模、检索结果重排序、交互反馈策略等三个方面对网络视频检索关键技术展开深入研究,取得了如下研究成果:   1.基于社区挖掘的视频上下文建模和排序方法   网络视频具有的丰富的多模态上下文信息是对视频内容的有益补充,可以辅助对视频内容的理解。本文提出一种新颖的基于社区挖掘的视频上下文建模和排序方法。该方法首先将用户、视频、文本标签三种实体及其多模态关联关系表示成一个异质关联网络,通过挖掘其中的社区结构,获得蕴含在多模态上下文中的一致性信息;其次,基于上述社区结构,通过构建社区-视频二分图实现视频的检索排序。本文方法可以降低对大规模视频集分析的复杂度,并降低单一模态上下文信息带来的噪声。在YouTube网络视频数据集上的实验表明本文方法可以有效提升视频检索的性能。   2.基于多尺度社区挖掘的视频重排序方法   视频重排序方法旨在通过挖掘数据内在关联,对原始检索结果进行重新排序,对于提高视频检索质量具有重要意义。本文提出一种基于多尺度社区挖掘的视频重排序方法,以综合实现网络视频用户对于检索结果相关性和多样性的排序要求。该方法首先通过查询到社区结构的映射获得查询相关社区,保证检索结果的多样化主题分布;然后在查询相关社区对应的局部关联网络中挖掘多尺度子社区结构,实现与之对应的树状随机图模型的概率估计,并进一步通过与查询节点相关的潜在链接预测,获得与各查询子主题高度相关的视频。实验结果表明,本文方法对初始检索结果的性能提升达到21.3%,同时实现对查询相关主题的多样化分布,提升了用户的检索体验。   3.基于社区的交互式视频检索方法   交互式视频检索致力于在检索过程中引入用户的指导,使检索结果更加符合用户的查询意图,以实现个性化的用户要求,是网络视频检索中的关键问题。本文提出一种基于社区的交互式视频检索方法。利用发现的社区结构,对大规模视频集进行区域化组织,在此基础上提出一种分层的相关反馈算法。该方法通过在社区间和社区内部的分层反馈来兼顾标注样本的全局和局部上下文,可以降低反馈算法的时间消耗,适应交互式检索的快速反应需求。此外,设计了一种基于社区地图的交互模式,将标注样本在社区中的模块化分布直观地显示给用户,为用户标注提供有效指引,大大提高了用户反馈的效能。在TRECVID2009交互式检索视频集上的实验结果表明:与经典的反馈算法相比平均检索精度增幅达22.2%~50.8%;同时,通过对基于该技术开发的原型系统VideoMap进行用户打分,验证了本文提出的交互模式的有效性。
其他文献
行人检测是计算机视觉领域的关键问题,而且是行人运动视觉分析领域其它相关工作的基础,有着广阔的应用前景。行人检测系统的构造一般包括以下几个步骤:图像预处理、特征设计与提
伴随着信息技术的飞速发展,信息安全提升到了国家战略和国家安全的高度。隐蔽信道作为信息安全领域中的经典研究课题,是一种通过共享资源破坏系统隔离性进而实现信息泄露的方式
应用对计算能力的需求永无止境,推动高性能计算机从百万亿次发展到千万亿次量级。为了应对日益增长的计算需求,当前的高性能计算机广泛使用多核处理器,并且采用专用加速部件
IP智能物件(IPSO)通过使用互联网的IP核心技术和普适计算的嵌入式技术,能够实现更大范围的互联,具有广阔的应用前景。它强调物理世界和信息世界的融合,是实现普适计算和物联
本系统主要由总控管理器和三个机载大气探测设备(机载大气环境激光雷达、机载差分吸收光谱仪、机载多角度偏振辐射计)组成。其中总控管理器通过计算机网络对三个机载大气探测
通过计算彩色水印图像各分量的能量值作为各分量水印的嵌入系数,分别提出了基于能量值的二维离散余弦变换和四元数离散余弦变换的彩色图像水印算法,水印嵌入系数是自适应的,并具
卫星通信是一种理想的长途通信,它可以克服地理条件的限制,提供廉价、稳定可靠的信道。它具有全球覆盖,接入简单,扩展性强和带宽按需可变等优点,除通信外,也在气象预测、环境监测、
传统的网络文件系统客户端利用页缓存来缓存服务器端的数据。然而,随着全球数据量的指数级增加,以及内存资源的稀缺性,如何提升网络文件系统对于海量数据的前端读写性能、降
密码学是信息安全的核心基础,密码算法的安全性是各类信息需求的基本保障。随着计算机能力的不断提升,自动搜索算法在密码的设计与分析中发挥了重要作用,成为密码学研究的一大热
人工神经网络是一个优越的通用逼近器,且得到了很好的发展和应用。但是由于存在一些缺陷,如“黑箱”特性和忽视存在的先验信息,神经网络的发展和应用受到了很大程度上的限制