论文部分内容阅读
随着多媒体技术的发展,广播电视节目中的自动广告检测技术成为当前研究的热点,具有重要的研究意义和应用价值。目前,自动广告检测方法以基于识别的方法最为成熟,即主要思想是利用已知广告库中的广告片段检索节目中的广告。这就要求预先建立一个大而全的广告数据库,需要不断的更新加入新出现的广告,并且不能够检测出广告库中没有的广告。
针对上述问题,本文提出了一种基于音频重复性的广告检测方法。该方法基于广告在节目中重复出现的特点,能够自动检测并精确定位出广播电视节目中重复出现的广告。
本文提出的广告检测系统由四部分组成:基于能量曲线的音频分割、基于包络形状的音频重复性检测、基于语义内容的细粒度匹配精确定位重复单元的位置以及去除噪点现象。最后提出了设计一个大规模广告库的规则,以及更新广告库的方法。本文所提出的方法是利用音频流的时间序列信息和完整的能量包络曲线,把音频数据流切分成片段单元。利用基于时间跨度和概率统计相结合的重复性检测方法,寻找在能量曲线形状上具有重复性的音频匹配序列。利用音频转换点检测函数检测语义内容上相似的匹配单元,并精确的定位匹配单元的起始和结束位置。利用基于音频区域相似性评价函数的方法解决噪点现象,进一步提高系统的性能。
实验结果表明,该方法对于多样的广播电视节目都取得了较好的性能,且具有很强的抗噪性。在44小时的广播电视节目上测试的结果为:对于重复性的广告具有超过98%的准确率和94%的召回率。