音视频信息融合的说话人跟踪算法研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:pz11200618
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对单独的音频和视频信息跟踪的缺陷,提出了一种音视频信息融合的粒子滤波跟踪算法。采用闭环跟踪框架,分为底层跟踪、融合、重要性粒子滤波、跟踪输出和反馈五个环节。底层跟踪环节利用说话人脸部肤色信息进行均值漂移跟踪的同时,利用说话人声音信号到达麦克风阵列的时间延迟进行跟踪定位;融合环节对这两者得到的跟踪信息进行整合,得出基于音视频信息融合的重要性函数和融合似然模型;滤波环节利用重要性粒子滤波算法对融合的数据进行滤波处理;跟踪环节根据滤波结果对说话人进行跟踪;反馈环节将跟踪结果动态反馈给人脸肤色跟踪和声源定位跟踪
其他文献
《红楼梦》是中国古代四大名著之一,是中国文化的瑰宝。教育人看来,《红楼梦》是中国古代教育的一个缩影。教育很重视,家庭教育各有千秋。
<正>夏季覆土栽培香菇和脱袋竖地栽培香菇的技术因与架式栽培香菇技术不同,因而在北方通称为地栽香菇或速生菇。由于该栽培方法在承德出菇时间在6~9月份,正好填补了架式栽培出
飞机着滑灯由于亮度高、工作电压高、寿命短而不同于普通照明白炽灯。使用针对普通白炽灯灯丝设计而开发的软件对着滑灯灯丝进行设计时,设计误差超过20%。在白炽灯灯丝设计理论
大象无形,对于建筑设计,倘是拘泥于某一种原则,某一种标准,那么建筑设计就将停滞于一定的限制之中,只有不断创新,捐弃定则,才能创造出与时俱进的建筑形式,才能使我国的建筑形
“新时代”作为我国发展新的历史方位的重大判断,是中国共产党根据国家和社会现实需要,适应中国特色社会主义建设新时期的主要任务,对马克思主义哲学基本要旨进行的创造性运
文章以半年时间的产学研合作专业综合实习为载体,长江大学园艺学生在企业或者研究单位进行实践,实现“实习与创新相结合”。通过参与科学研究和园艺生产,提高了学生对社会的
介绍了上海光源液氮冷却单色器的工作原理,描述了在EPICS环境下实现单色器步进电机控制、能量扫描和探测器信号实时获取、晶体切换和高度补偿以及单色器姿态参数保存等功能。