基于一种听觉模型的特征提取及语音识别

来源 :南京理工大学学报 | 被引量 : 0次 | 上传用户:fffdsa4te
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文分析了人耳耳蜗及中枢听觉神经对声信号处理的机理,主要包括耳蜗对声信号的频率分析、柯蒂氏器官毛细胞的从振动机械能到电化学能的转换、听神经的侧抑制神经网络(LIN)和增益调整四个层次,建立各个层次上听觉的数学模型。模型的最终输出即为用于识别的语音特征。辨识实验结果也表明此听觉模型特征能较好地表征语音本质。 This paper analyzes the mechanism of acoustic signal processing in cochlear and central auditory nerve of human being, including the frequency analysis of acoustic signals in cochlea, the conversion from mechanical vibration energy to electrochemical energy in Cortina’s organ cells, Network (LIN) and gain adjustment of the four levels, the establishment of mathematical models of auditory at all levels. The final output of the model is the speech feature used for recognition. The experimental results also show that the characteristics of the auditory model can better characterize the nature of the speech.
其他文献
赣北石门寺钨多金属矿床位于下扬子成矿省江南地块中生代铜钼金银铅锌成矿带中,是燕山期花岗岩岩浆期后热液矿床.也是最近查明的中国规模最大的钨矿床大湖塘钨矿北矿段。通过对
本文利用广州白云机场1982~2001年的逐时观测资料,对雷暴的气候特征进行统计分析.结果表明:白云机场年平均出现雷暴日数为67天,初雷一般在2月26日,终雷一般在10月15日,1年12个
苏州姑苏区人口密度大,人口老龄化问题较为突出,为老龄产业的发展带来了机遇与挑战。文章在对姑苏区老龄产业的需求进行调查的基础上,分析了老龄产业的发展现状,进而提出了姑
<正>讲起上海的老饭店,年长一些的上海人都会不约而同地提起上海国际饭店,以及曾经广为流传的对"远东第一高楼"仰望落帽的趣闻美谈。
对浸出采铀过程中,影响浸出液铀浓度的因素,诸如垂向上地下水、钻孔抽液流量、过氧化氢用量等进行了研究,结果表明:地下水对浸出液的垂向稀释应限制在一定范围内;钻孔抽液流量仅在
随着“双一流”建设的不断深入推进,国内的戏剧影视表演教学在国际化、多元化、现代化的发展进程中不断进行着探索与改革。各大院校在强化自身特色与优势的同时,海纳百川、集
通过对茂名市城区附近小东江污染源的调研,分析水质沿程变化特征,指出茂名市工业污染源对小东江上中游河段的水质变化起主要作用,但河流水质基本尚能达到水功能区的水质管理目标
研究基于SPSS分析指导的运动员关节损伤预防与治疗.关节损伤是制约运动员成绩提高的主要因素,提出一种基于SPSS分析指导的运动员关节损伤预防与治疗.采用统计学分析的思想,在
本文讨论了在无穷维自反Banach空间上的具有Lipschitz连续G-导数的函数f(x)的极小化序列,通过微分方法在一定条件下得到一个收敛性定理。
介绍了氢氧化镁阻燃剂的特性、阻燃机理及改性技术进展,指出了今后的发展方向。