说话人转换点检测与句边界检测方法研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:wsionw47071
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
进入二十一世纪,科技的发展更为迅猛,尤其在计算机应用方面,随着计算机处理器性能的提高、存储设备存储量的不断扩大、计算机网络性能的提升、以及相应的成本的不断降低,越来越多的科技因素注入我们的日常生活。体现在语音信号处理研究领域,以上的发展最直接的表现是海量的、来源广泛的语音数据的出现,如广播语音,电话语音,语音邮件(VoiceMails),会议录音等。 本文主要开展的是语音信号的预处理算法的研究,包括:语音检测,说话人转换点检测以及句边界检测算法的研究。以期使设计的算法能够足够的鲁棒,以适应多种类型数据的需求。 本文实现了基于在线训练的HMM的语音检测算法。实验证明该算法在包括广播语音、会议类语音等多种语料库的语音检测方面,都得到了较好的结果。 本文结合说话人识别领域中的研究成果实现了基于UBM-GMM结合得分归一化的说话人转换点检测算法,对算法进行了优化。通过实验证明,该算法很好地克服了当前主流方法易受非说话人语音相似性的影响的缺陷,在多种语料库中得到了较以往方法更高的检测结果。 本文实现了基于语音学韵律信息的句边界检测算法。通过实验验证了此方法在不依赖语言学信息的句边界检测任务中的可行性。 综合以上,本文通过对现有方法的调研和改进,实现了包括语音检测,说话人转换点检测和句边界检测算法设计,并检验了算法在多种类型数据上的鲁棒性。
其他文献
波前处理机是自适应光学系统运算和控制的核心,是联系波前传感器和波前校正器的枢纽。本文在对波前处理机的发展现状和趋势进行深入调研的基础上,设计并搭建了基于双核CPU和RTL
蛭弧菌是一类专门以捕食其他细菌,特别是革兰氏阴性细菌为生的寄生性细菌。蛭弧菌宿主范围广泛,不仅能裂解大肠埃希氏菌、沙门氏菌等常见的细菌,还能寄生于变形杆菌属、假单胞菌
TCP拥塞控制算法曾为当今网络有效的使用立下赫赫战功。然而,近些年来,在高带宽时延乘积(BDP)链路上,TCP拥塞控制算法越来越力不从心。这主要是由于标准TCP AIMD拥塞控制算法增
本文通过对荣华二采区10
期刊
遥感卫星数据记录系统是遥感卫星地面接收站系统中的关键技术环节。近些年来,随着网络与计算机等相关技术的迅猛发展以及遥感技术在各个领域的广泛应用,如何利用这些新技术和新
随着计算机技术和通信技术的迅速发展以及Internet的不断发展,嵌入式系统已经广泛地渗透到科学研究、工程设计、军事技术、各类产业和商业文化艺术以及人们的日常生活等方方
重金属Pb作为毒性较高的环境毒物,不仅危害植物的生长和发育,也对人类健康带来严重威胁。水杨酸(salicylic acid,SA)作为一类新型植物生长调节物质,在诱导植物抗病性、激活植物
运动目标跟踪是计算机视觉处理中的一个热点,有着非常广泛的应用前景;同时视觉环境的多样性和复杂性使其成为图像处理领域的难点。本文以均值平移算法为核心算法,并针对其固有缺
本文提出了采用BP合成神经网络和菲涅尔转换技术建立了一种计算机合成全息图像(CGH)压缩处理的新结构,这种处理结构能够自适应地调整处理非线性的计算全息信息分布。 在研
研究3+9×0.175NT钢丝帘线在轻型载重子午线轮胎胎体中的应用.结果 表明,采用1层压延密度为83根·dm-1的3+9×0.175NT钢丝帘布替代3层压延密度为110根·dm-1的1670dtex/2-28E