论文部分内容阅读
近几年,网络电话(VoIP)得到了快速的发展,其工作原理是先对语音信号压缩编码,然后以数据包的形式在IP网络中进行传输。与传统的公共交换电话网络(PSTN)相比,VoIP具有低成本以及支持多媒体业务等优点。然而,VoIP采用不可靠的用户数据报协议(UDP)进行数据传输,其语音质量得不到保障。如何提高VoIP技术的可靠性以及有效性成为了当下一个亟待解决的问题,而性能提升的前提是建立一个有效的VoIP语音质量评估模型。VoIP语音质量评估模型分为主观模型和客观模型,其中主观模型能直接反映人对语音质量的感知,但耗费大、耗时长、不易实现,使用范围也受到了限制。客观模型中感知语音质量评估算法(PESQ)与主观模型的相关度最高,但是,它需要输入原始语音和损伤语音,是一种侵入式模型。此外,PESQ没有考虑编码、丢包、延时和抖动等VoIP网络影响因素。P.563是非侵入式的客观评估模型,不需要输入原始语音,但是它与主观评估的相关度比较低,语音评估的准确性不高。参数模型E-Model能够反映网络损伤因素对语音质量的影响,但算法复杂高,且没有考虑抖动的影响。针对现有的模型所存在的问题,本文旨在建立一种客观的、非侵入式的、能够在实时网络中进行端到端语音质量评估的模型。本文在第3章提出了一种基于回归分析的考虑丢包和编码的语音质量评估模型。该方法结合自适应多速率窄带语音编码(AMR-NB)和Gilbert丢包模型来生成编码损伤模型与丢包损伤模型,再利用P.563模型评估语音质量。最后,通过回归分析建模得到基于丢包和编码速率的语音质量评估模型。在实际应用环境中,抖动也是影响VoIP语音质量的一个重要因素。因此,本文在第4章提出了一种基于回归分析的考虑抖动和编码的评估模型。该方法通过搭建抖动仿真平台生成抖动损伤模型,结合P.563评估的语音质量,通过回归分析建模得到基于抖动和编码速率的语音质量评估模型。仿真结果证明了本文所提方法的有效性。