论文部分内容阅读
本文对语种识别和说话人识别的关键技术进行了深入研究.语种识别采用基于声学特征的识别方法,提取了美尔综合倒谱(MGCEP)声学特征;用特征组织变换SDF(shift delta feature)加强了音素之间的相互关联性;语种识别率可以达到93%以上.说话人识别采用了多特征多模型构架,特征使用了线性预测倒谱(LPCCEP)、对数面积比(LAR)和听觉感知参数(PSP);模型采用了矢量量化(VQ)和高斯混合密度模型(GMM);运用信息融合方法进行综合判决,整体性能较单特征单模型方法有较大提高.说话人识别准确率可以达到95%以上.