论文部分内容阅读
进入二十一世纪,科技的发展更为迅猛,尤其在计算机应用方面,随着计算机处理器性能的提高、存储设备存储量的不断扩大、计算机网络性能的提升、以及相应的成本的不断降低,越来越多的科技因素注入我们的日常生活。体现在语音信号处理研究领域,以上的发展最直接的表现是海量的、来源广泛的语音数据的出现,如广播语音,电话语音,语音邮件(VoiceMails),会议录音等。
本文主要开展的是语音信号的预处理算法的研究,包括:语音检测,说话人转换点检测以及句边界检测算法的研究。以期使设计的算法能够足够的鲁棒,以适应多种类型数据的需求。
本文实现了基于在线训练的HMM的语音检测算法。实验证明该算法在包括广播语音、会议类语音等多种语料库的语音检测方面,都得到了较好的结果。
本文结合说话人识别领域中的研究成果实现了基于UBM-GMM结合得分归一化的说话人转换点检测算法,对算法进行了优化。通过实验证明,该算法很好地克服了当前主流方法易受非说话人语音相似性的影响的缺陷,在多种语料库中得到了较以往方法更高的检测结果。
本文实现了基于语音学韵律信息的句边界检测算法。通过实验验证了此方法在不依赖语言学信息的句边界检测任务中的可行性。
综合以上,本文通过对现有方法的调研和改进,实现了包括语音检测,说话人转换点检测和句边界检测算法设计,并检验了算法在多种类型数据上的鲁棒性。