面向足球比赛的音频内容分析技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：sunleilong

【摘要】

：

足球比赛是大众普遍喜爱的一种体育运动，每年都有许多的足球比赛电视转播。一场足球比赛通常在90分钟以上，由于视频媒体的时序性和无结构性，使得对于这些大量的视频媒体的人工编

【作者】

：

杨翠丽

【机构】

：

南京大学

【出处】

：

中国科学院大学

【发表日期】

：

2015年期

【关键词】

：

足球比赛电视转播音频内容处理音频结构化音频分割音频分类

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

足球比赛是大众普遍喜爱的一种体育运动，每年都有许多的足球比赛电视转播。一场足球比赛通常在90分钟以上，由于视频媒体的时序性和无结构性，使得对于这些大量的视频媒体的人工编辑、浏览以及检索是一件非常低效的工作。人们迫切希望有一种自动化分析工具来帮助他们加快对这些比赛视频媒体处理。早期的视频内容分析研究主要集中在图像和视觉信息的处理，然而，相比图像、视频的处理，音频处理的计算代价要小很多；而且，声音媒体在表达某些内容语义上有着明显的优势。因而，视频中的音频内容处理逐渐成为了近年来的研究热点。音频内容分析，就是利用音频处理技术，分析音频流中的内容语义，进而实现音频流的内容结构化，建立音频、视频流的内容索引结构。　　本文以电视转播的足球比赛中音频内容为研究对象，对其内容分析技术展开了研究，提出了一套适合足球比赛音频内容的分类体系和相关处理技术，细化了足球比赛音频内容的分析粒度，同时还可以为听觉障碍人士提供音频效果的文本提示，提高他们观看足球比赛时的现场融入感。　　本文的主要工作可以概括为以下几个部分：　　 1.提出了足球比赛音频内容分类体系和分析架构足球比赛音频是一种内容非常丰富的媒体，出于不同的应用目的，人们对足球比赛音频内容的分类也不尽相同。本文从辅助听觉障碍人士观看足球比赛以及足球比赛音频内容结构化分析的目的出发，提出了足球比赛音频内容的分类体系，并结合足球比赛音频内容特点，给出了足球比赛音频内容分析框架。　　 2.提出了基于自适应阈值的多尺度融合音频分割技术基于距离的音频分割技术从音频片段相似与否的思想出发将音频流分割成为一系列具有单一内容语义的音频片段。本文从距离阈值自适应的角度出发，设计了阈值自适应策略，并通过设计启发式规则对于多个尺度的音频分割结果进行合并，它能显著减少音频分割过程中的人工干预，并有效地提高了召回率。　　 3.研究了原始足球比赛音频内容的细粒度分类处理技术特征选择和分类器设计是分类问题的两个技术难点。特征选择有助于减少计算时间，提高分类精度，针对本文提出的足球比赛音频内容分类体系，基于决策树和前向搜索算法相结合的特征选择过程，根据分析得到了一个足球比赛音频分类特征集，并进行了分类实验。　　基于上述研究工作，本文提出了增量式的足球比赛音频内容分析过程，设计了一个面向听觉障碍人士的足球比赛音频内容分析原型系统，该系统中实现了音频特征提取、音频分割、音频分类等功能模块。　　

其他文献

基于JPEG2000图像的数字化混沌密码系统的设计与实现

要提供安全的图像数据通信,在系统设计时必须考虑两个要素：第一,尽量减小传送数据的体积。第二,保证数据安全。因此,需要一种对图像的压缩加密方法。本文将JPEG2000与数字化混

学位

数据通信数据通信密码系统密码系统图像传输图像传输

实时视频事件智能检测技术研究及其在高速公路中的应用

智能视频监控技术是指对视频图像中的目标进行自动的检测、跟踪和分析,从而使计算机能够过滤掉用户不关心的信息,通过分析理解视频画面中的内容,提取对监控和预警有用的关键

学位

智能视频监控智能视频监控车辆检测车辆检测滤波跟踪算法滤波跟踪算法高速公路高速公路自适应阈值自适应阈值

面向沉浸式环境的色彩高保真显示方法研究与应用

沉浸式投影显示在文化教育、游戏娱乐、医疗模拟、工业设计等方面都得到了广泛应用。其中，用于鉴赏与研究的文化遗产显示对色彩的保真度有很高的要求，而且需要能给不同鉴赏者或

学位

投影显示系统色彩保真度一致性感知沉浸式环境

基于对象Petri网的跨组织软件过程建模研究

随着经济全球化及跨国公司的不断发展，近年来软件外包及全球配送业务得到了突飞猛进的发展。一个软件产品或项目的需求、设计、开发及测试等环节可能外包给不同的组织完成，传统

学位

对象Petri网跨组织软件过程建模方法过程框架交互协议同步关系

笔式用户界面研究——理论、方法和实现

该文提出了以用户为中心的智能笔式用户界面研究方法、基于混合自动机的交互模型、笔交互的增量式意图提取技术、支持笔式用户界面开发的平台Penbuilder和支持笔记记录和胶片

学位

笔式用户界面用户界面设计增量式意图提取SketchLEAFFPenbuilderSketchPoint

计算机桥牌程序的设计与实现

互联网的迅猛发展加速了社会的进步,给人们的生活带来了巨大的变化。伴随着网络的发展和软件技术的革新,游戏开发也由单机版过渡到网络化。目前,网络游戏的市场越来越大,它吸

学位

网络游戏桥牌大厅深度优先搜索人工智能

无线射频识别（RFID）物流通关公共服务平台中心数据库的研究与设计

随着物流信息化建设不断发展和无线射频识别(RFID,Radio FrequencyIdentification)技术应用的不断深入,我国的物流通关信息化建设出现了物流标准化滞后和缺乏统一的物流信息

学位

射频识别射频识别物流通关物流通关服务平台服务平台数据库设计数据库设计

XBRL知识表达模型的分析与改进

XBRL(eXtensible Business Reporting Language，可扩展商业报告语言)是一种基于XML的报告语言。XBRL已经在证券、保险、银行等各金融行业得到了广泛的支持和应用。在XBRL的应

学位

可扩展商

3D立体显示技术在气象领域中的应用研究

立体显示技术经过几十年的发展，取得了很大的进展。目前，对立体显示技术主要分为立体眼镜、Autostereoscopic3D显示、体三维显示和全息三维显示技术四大类，其中立体眼镜和Autost

学位

气象数据

软件需求管理框架的研究及设计

软件需求是软件研发项目初始估计和计划的基础，同时也是软件产品开发和验证的基础。根据Standish Group从1994年到1997年的Chaos Reports证实，导致项目失败的最重要的原因与需

学位

软件产品需求管理过程集成框架模块设计项目管理

面向足球比赛的音频内容分析技术研究

其他学术论文