基于主题匹配与信息融合的交互式视频检索框架

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:pingli_lp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术和互联网技术的飞速发展,以视频为代表的多媒体数据正在以惊人的速度增长。面对如此丰富、无序、海量的多媒体数据,如何实现所需资源的有效组织、高效检索和快速获取已成为人类社会面临的巨大挑战,同时也使多媒体检索技术迅速成为当今最热门的研究领域之一。   基于内容的视频检索(CBVR)是多媒体检索领域的重要分支,它摆脱了人工文本标注的传统方式,直接对视频所蕴涵的物理和语义内容进行分析与理解以达到快速准确的检索效果。本文通过对高层语义特征、视频检索机制、相关反馈算法和多源信息融合等四个方面的研究,提出一套新型的基于基本语义的CBVR系统-“基于主题匹配与信息融合的交互式视频检索框架”,其主要贡献包括:   (1)提出基于模型匹配策略和主题匹配策略的视频特征提取方法。定义新型中层特征——模型匹配相关图用以精确描述视频序列的时空信息;定义新型高层特征——主题直方图用以实现语义关键词的自动标注和对视频基本语义内容的表征。   (2)提出基于非监督学习的视频检索机制。使用Dominant Set聚类算法,建立基于非监督学习的索引结构和基于聚类索引的查询机制,显著降低了检索系统的在线计算复杂度同时实现了对数据库更为有效的管理。   (3)提出新型的视频检索相关反馈技术——基于语义的分支反馈算法。该算法采用分支反馈结构和分支更新策略,通过在线补偿监督信息来校正主题直方图所标记的不恰当的语义关键词,进而显著提升系统的检索性能。   (4)建立基于颜色信息和运动信息融合的视频检索模式。使用光流分析方法描述视频帧间的局部运动信息,并将其作为视频的底层图像特征嵌入主题匹配策略生成基于运动信息的主题直方图;使用Dempster-Shafer证据理论将基于颜色信息的主题直方图和基于运动信息的主题直方图进行融合,从而实现基于多源信息融合的视频检索。   (5)根据上述四部分研究,设计并实现了“基于主题匹配与信息融合的交互式视频检索原型系统”--“SMIF VideoSearch系统”。  
其他文献
音视频数据作为一种动态、直观、形象的数字媒体承载了大量丰富的语义信息,越来越多地出现在各类信息服务和应用场合,如何自动而高效地从大量音视频数据中挖掘出有效信息,理解其
学位
近年来,推荐系统的研究变得极为火热,这主要因为,推荐系统能从大数据中提供个性化信息给用户,而这些数据往往是非常嘈杂和难以利用的。传统的方法是利用“用户-物品”的评分矩阵
由于安全评估技术是理解系统安全状态的重要手段,国内外组织和机构先后制定了一批安全评估标准和方法,典型的标准包括美国的TCSEC[5],美国标准局的NIST-SP800[8],欧洲的ITSEC[6]
学位
用户规模万级以上的网络信息系统数量呈指数级增长态势,是当前互联网发展的一个基本事实。用户使用系统的行为往往受到网络中其他个体以及群体使用方式的影响。因此,如何在网络
学位
随着移动计算技术的发展,功耗问题已经成为制约嵌入式系统发展的重要因素之一。动态电压调节(DVS)技术是一种通过在线调节系统工作电压/频率的低功耗技术,在保证系统性能的同时
与传统的人工抄表系统相比,自动抄表(Automatic Meter Reading)系统具有高效、便捷、准确等优点,已广泛应用于水、电、气等公共服务事业中。针对AMR系统在无线通讯、数据安全和
随着计算机的普及以及互联网的迅猛发展,知识获取的来源、数量和形式也随之发生了根本的变化.目前,在Internet的数据中蕴含了海量的知识,同时也含有大量的垃圾信息,完全人工
伴随着移动网络和移动终端性能的不断提高与完善,手机游戏增长势头远远超过其他移动数据业务,已经逐渐成为一个生机勃勃而又潜力巨大的文化产业。现阶段的手机游戏发展滞后于手
随着互联网上多媒体数据的日益增长,通过一种模态数据检索另外一种模态数据(例如,以文本检索图像)的跨媒体检索具有广泛的应用并日益受到关注。跨媒体排序是跨媒体检索中的一个重
伴随着网络技术的飞速发展,Web服务的应用范围在不断地扩大。越来越多的Web服务被作为共享服务提供给请求者使用,而Web服务种类的多样化也造成了在其之上的发现和集成效率的