【摘 要】
:
基于多模态的检测方法是过滤成人视频的有效手段,然而现有方法中缺乏准确的音频语义表示方法。因此本文提出融合音频单词与视觉特征的成人视频检测方法。先提出基于周期性的能量包络单元(简称EE)分割算法,将音频流准确地分割为EE的序列;再提出基于EE和BoW(Bag-of-Words)的音频语义表示方法,将EE的特征描述为音频单词的出现概率;采用复合加权方法融合音频单词与视觉特征的检测结果;还提出基于周期性
【机 构】
:
湖南科技大学计算机科学与工程学院,湘潭411201中国科学院计算技术研究所,北京100190湖南省知识处理与网络化制造重点实验室,湘潭411201;中国科学院计算技术研究所,北京,100190;