基于内容的视频检索系统研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:weifeng151
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着视频信息的大规模引入,基于关键字的传统检索技术已不能适应人们的需要,近年来,基于内容的检索成为研究的热点。本课题分析了现有的视频检索理论框架,并对传统的文字识别算法加以改进,实现了视频帧中复杂背景下的实时文字检测与数字识别。对视频中文字的丰富的语义信息加以分析,在镜头分割、场景聚类的基础上形成镜头描述的特征空间,建立了以文字信息为主要特征的视频检索系统。 本课题以篮球比赛的视频片断为例,主要进行了以下几个方面的研究:1)针对视频中的“闪动”和“急跳”现象,提出了“二级镜头分割算法”,解决了镜头边缘的误识别问题。2)对所检测出的视频片断或整个视频流进行播放。3)基本解决了复杂背景下文字检测与定位问题,提高了数字的识别速度与正确率。4)文字区域的检测分为固定区域和非固定区域的文字检测,本文采用“双阈值窗口检测法”算法讨论了对固定区域的探测。5)使用改进了的模板匹配方法实现对印刷体文字进行识别,在传统的模板匹配基础上,提出了“二值化掩码模板”和“三灰度加权匹配”的算法。 本系统以Microsoft Window 2000 professional为操作平台,采用Microsoft Visual Studio C++6.0为工具开发出"NBA篮球比赛视频检索系统”(简称NBVRS)。该系统采用模块化设计,层次分明,界面友好,识别正确率高,且基本满足了用户 西安理工大学硕士学位论文实时性检索的要求。同时,该软件还具有视频的括放功能。最后对系统所采用的算法进行了实验验证,并指出了后续研究的方向。 本课题在原有的视频检索框架上对视频片段的语义内容加深了理解,基本达到依靠比分来进行播放的目的,虽然与实用阶段还有距离,但对于其它研究有着借鉴意义,并具有良好的应用前景。
其他文献
WAP(Wireless Application Protocol)是无线应用协议之意,它融合了移动通信和Internet两项技术。它充分考虑了无线信道的固有特点(如信道稳定性差、衰减干扰大、带宽窄、时延
防火墙是一种保护本地系统和网络,抵制基于网络的安全威胁,同时提供通过广域网和因特网对外界进行访问的有效方式。防火墙是一种有效的防御措施,它能增强内部网络的安全性,能够防
本文的主要工作是在对几种典型的多用户检测中技术研究的基础上,着重探讨基于信号子空间的多用户检测技术,并对其性能进行仿真分析。全文内容主要分为以下几个部分: 1.简要回
随着科技的日新月异,个人计算机和互联网的普及,无线应用的广泛深入,多媒体技术也得到了长足的发展.从Motion JPEG发展到了Motion JPEG2000.Motion JPEG2000是新的无帧间编码
并行处理是指同时对多个任务或多条指令、或多个数据项进行处理,从而大大提高计算速度。实现这种并行处理的计算机系统称为并行计算机系统。并行计算采用并行程序实现,并行程序
本文重点研究了宽带流媒体应用的解码、宽带流媒体服务器、流媒体传输的质量控制等关键技术问题。作者提出了宽带流媒体服务器的直接访问并行IO体系结构-PPA ,并对PPA体系结构
目前所见到的自动调制制式识别的文章都是基于某一方面的,如:基于恒包络的调制(CW、FSK、PSK),基于多进制的QAM调制(4QAM、8QAM、16QAM)和基于多进制的MFSK、MPSK调制等,没有覆盖
在许多数字通信的应用中,传输的数据比特序列都由不同的重要性,因此产生了一些不等误差保护方案。H.263的基准句法结构对信道干扰非常敏感,通过试验我们可以得到在传输速率在32k
本文首先介绍了PACS系统的概念,然后对它的系统组成,相关技术以及规模特点等做了系统的描述。在随后的章节中我们主要介绍了对于构建PACS系统极为重要的DICOM通信协议,介绍了它
随着计算机科学、人工智能以及多媒体技术等学科的发展,以及各类具有摄像功能的移动电子设备逐渐普及,使得越来越多的信息载体以图像形式存在。图像中的文本识别对于基于内容