论文部分内容阅读
随着计算机技术与相关应用的发展,科学视频的数量呈现了爆发性的增长趋势,作为一类非常重要的非文本(Non-Textual)数字资源,科学视频的学术价值得到了越来越多科研人员的认可。一些科研机构与商业公司已经开始着手对科学视频进行收集与保存。面对不断增长的科学视频数量,如何对这些规模庞大的科学视频数据进行有效的组织和开发与利用是当前面临的主要挑战;另外,从用户角度看,通过快进、快退等简单操作浏览视频的传统方式也已经不适应用户快速摄取专业知识的需求。因此,实现对科学视频的结构化、语义化浏览与导航是解决当前存在问题的主要研究方向。作为视频检索的必要基础,视频索引问题的解决将为基于视频数据库和互联网的搜索应用提供基本的技术支持。而基于视频内容分析的语义标注是建立高性能视频索引的十分有效的方法。科学视频的自动语义标注就是在对科学视频进行语义内容分析与结构分析的基础上,为科学视频的关键帧、镜头以及场景等视频对象自动分配相对应的高层语义概念,以反映视频的真实内容。科学视频自动语义标注一方面可以解决人工标注所带来的费时费力等问题,提高科学视频标注的效率;另一方面可以实现科学视频的结构化、语义化浏览与导航以及科学视频及其片段的语义化检索。 本论文的研究工作主要包括以下几个方面: 首先,对国际上主要的视频自动语义标注方法、技术与工具进行了跟踪研究,调研分析了科学视频类型与特征,根据科学视频的特征确定了适用于科学视频的自动语义标注方法与技术。研究并分析了科学视频自动语义标注系统所需的语音识别技术、视频分割技术以及文本预处理工具等;分析了用于识别科学视频高层语义概念的领域本体;选取W3C发布的媒体片段标识符来标识科学视频片段并使用媒体资源本体来描述与表示科学视频资源的语法以及语义特征。这些是本文研究的基础。 其次,在跟踪研究的基础上构建了科学视频自动语义标注系统的框架。框架主要包括三个部分:科学视频内容语义分析模块、科学视频结构分析模块以及语义标注模块。科学视频内容语义分析就是在对科学视频语音进行识别的基础上,从中抽取出视频所包含的可被人类理解的高层语义概念;结构分析就是利用相关原理与技术把科学视频分割为逻辑单元明确的视频片段,如:关键帧、镜头以及场景等。在语义分析与结构分析完成后,还需要把高层语义概念与视频片段进行映射,即完成最后阶段的语义标注过程。 最后,设计并实现了一个简单的实验系统,对所提出的科学视频自动语义标注框架核心部分进行了验证,分析了技术的可行性、有效性以及存在的问题和下一步的工作重点等。 综上所述,本论文分析并探讨了科学视频自动语义标注系统实现的框架、技术路线和实现方案等,希望为未来的相关研究提供借鉴。