基于内容的视频检索系统研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户：weifeng151

【摘要】

：

随着视频信息的大规模引入，基于关键字的传统检索技术已不能适应人们的需要，近年来，基于内容的检索成为研究的热点。本课题分析了现有的视频检索理论框架，并对传统的文字识别算法

【作者】

：

师鸣若

【机构】

：

西安理工大学

【出处】

：

西安理工大学

【发表日期】

：

2003年期

【关键词】

：

视频检索镜头分割模板匹配文字识别帧

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着视频信息的大规模引入，基于关键字的传统检索技术已不能适应人们的需要，近年来，基于内容的检索成为研究的热点。本课题分析了现有的视频检索理论框架，并对传统的文字识别算法加以改进，实现了视频帧中复杂背景下的实时文字检测与数字识别。对视频中文字的丰富的语义信息加以分析，在镜头分割、场景聚类的基础上形成镜头描述的特征空间，建立了以文字信息为主要特征的视频检索系统。本课题以篮球比赛的视频片断为例，主要进行了以下几个方面的研究：1)针对视频中的“闪动”和“急跳”现象，提出了“二级镜头分割算法”，解决了镜头边缘的误识别问题。2)对所检测出的视频片断或整个视频流进行播放。3)基本解决了复杂背景下文字检测与定位问题，提高了数字的识别速度与正确率。4)文字区域的检测分为固定区域和非固定区域的文字检测，本文采用“双阈值窗口检测法”算法讨论了对固定区域的探测。5)使用改进了的模板匹配方法实现对印刷体文字进行识别，在传统的模板匹配基础上，提出了“二值化掩码模板”和“三灰度加权匹配”的算法。本系统以Microsoft Window 2000 professional为操作平台，采用Microsoft Visual Studio C++6.0为工具开发出"NBA篮球比赛视频检索系统”(简称NBVRS)。该系统采用模块化设计，层次分明，界面友好，识别正确率高，且基本满足了用户西安理工大学硕士学位论文实时性检索的要求。同时，该软件还具有视频的括放功能。最后对系统所采用的算法进行了实验验证，并指出了后续研究的方向。本课题在原有的视频检索框架上对视频片段的语义内容加深了理解，基本达到依靠比分来进行播放的目的，虽然与实用阶段还有距离，但对于其它研究有着借鉴意义，并具有良好的应用前景。

其他文献

OPNET中WAP协议的实现及性能研究

WAP(Wireless Application Protocol)是无线应用协议之意，它融合了移动通信和Internet两项技术。它充分考虑了无线信道的固有特点(如信道稳定性差、衰减干扰大、带宽窄、时延

学位

WAPOPNET协议栈移动互连仿真性能

一种实用的微型防火墙系统设计

防火墙是一种保护本地系统和网络，抵制基于网络的安全威胁，同时提供通过广域网和因特网对外界进行访问的有效方式。防火墙是一种有效的防御措施，它能增强内部网络的安全性，能够防

学位

网络安全防火墙包过滤安全策略linux系统

第三代移动通信多用户检测技术的研究

本文的主要工作是在对几种典型的多用户检测中技术研究的基础上，着重探讨基于信号子空间的多用户检测技术，并对其性能进行仿真分析。全文内容主要分为以下几个部分： 1．简要回

学位

第三代移动通信CDMA系统多用户检测信号子空间

Motion JPEG2000硬盘录像系统

随着科技的日新月异,个人计算机和互联网的普及,无线应用的广泛深入,多媒体技术也得到了长足的发展.从Motion JPEG发展到了Motion JPEG2000.Motion JPEG2000是新的无帧间编码

学位

视频录像Motion JPEG2000JPEG2000视频插值

基于DVM的可视化并行程序开发平台设计

并行处理是指同时对多个任务或多条指令、或多个数据项进行处理，从而大大提高计算速度。实现这种并行处理的计算机系统称为并行计算机系统。并行计算采用并行程序实现，并行程序

学位

DVM并行程序设计可视化消息传递模型数据并行模型

宽带流媒体关键技术研究

本文重点研究了宽带流媒体应用的解码、宽带流媒体服务器、流媒体传输的质量控制等关键技术问题。作者提出了宽带流媒体服务器的直接访问并行IO体系结构－PPA ，并对PPA体系结构

学位

流媒体编解码服务器差速同步视频点播

软件无线电中基本调制制式的自动识别

目前所见到的自动调制制式识别的文章都是基于某一方面的，如：基于恒包络的调制(CW、FSK、PSK)，基于多进制的QAM调制(4QAM、8QAM、16QAM)和基于多进制的MFSK、MPSK调制等，没有覆盖

学位

软件无线电自动调制识别小波分析人工神经网络

基于H.263编码的无线视频通信差错控制技术研究

在许多数字通信的应用中，传输的数据比特序列都由不同的重要性，因此产生了一些不等误差保护方案。H.263的基准句法结构对信道干扰非常敏感，通过试验我们可以得到在传输速率在32k

学位

H.263误差容限联合信源信道编码(JSCC)不等误差保护(UEP)RCPC码

在PACS系统中实现分诊台和服务端子系统

本文首先介绍了PACS系统的概念，然后对它的系统组成，相关技术以及规模特点等做了系统的描述。在随后的章节中我们主要介绍了对于构建PACS系统极为重要的DICOM通信协议，介绍了它

学位

PACSDICOMHL7分诊台

基于自然场景的图像文字识别

随着计算机科学、人工智能以及多媒体技术等学科的发展,以及各类具有摄像功能的移动电子设备逐渐普及,使得越来越多的信息载体以图像形式存在。图像中的文本识别对于基于内容

学位

自然场景文字识别图像检索提取技术

基于内容的视频检索系统研究

其他学术论文