【摘 要】
:
该文以语音识别系统中语言模型和语义分析这两项技术为主线,以统计理论为依据,对特定领域的语音识别系统中的语言模型和语义分析进行了研究.首先,以开发一个自动电话语音转接
论文部分内容阅读
该文以语音识别系统中语言模型和语义分析这两项技术为主线,以统计理论为依据,对特定领域的语音识别系统中的语言模型和语义分析进行了研究.首先,以开发一个自动电话语音转接系统为背景,介绍了特定领域中基于分层语法模型的语言模型及其应用.该模型应用于语音识别中,和传统的N-gram模型相比,提高了识别率.它也可用于特定领域的语义分析中,利用高层语义信息把拼音汉字转换和语义标注两个过程有机的结合起来.该文还讨论了基于分类的词语言模型.在中文语音识别系统中,基于统计的字的N-gram模型的性能不佳,由于数据稀疏的问题,N-gram模型中的N只能取到3,而无法考虑更长距离的依赖.而词语言模型可以克服该问题.同样的,为了解决数据稀疏问题和进一步提高模型的性能,该文研究了分类的词语言模型.主要技术包括中文自动分词和语义聚类.
其他文献
趋化因子(趋化活性细胞因子)是一个小分子蛋白超家族,参与炎症反应过程中白细胞迁移。在一些神经退行性疾病中,如阿尔采默病(Alzheimer’s disease,AD),帕金森氏病(Parkinson
在直扩码分多址(DS-CDMA)系统中存在的多种干扰中,多址干扰对系统性能的影响最为强烈,多址干扰的强弱会直接影响到系统容量的大小。作为多址干扰抑制技术的主要技术手段,多用户
微管目前已经成为医药工作者研究与开发新型抗癌药物的重要靶点之一。微管是由不断聚合和解聚的α-和β-微管蛋白组成的异二聚体结构。这个动态的过程在各种基本的细胞过程中发挥着至关重要的作用,包括有丝分裂纺锤体形成、组织细胞结构、细胞内运输以及细胞信号转导和分泌。因此,通过抑制快速分裂的肿瘤细胞中的微管蛋白的聚合或者解聚,可以干扰细胞的有丝分裂使其中断,继而导致肿瘤细胞发生凋亡与损伤,发挥抗肿瘤作用。在过
[西班牙《先锋报》网站2月1日报道]题:从1918年西班牙大流感到新型冠状病毒:人类的隔离历史(记者 阿夫里尔·菲利普斯)rn为遏制新型冠状病毒感染肺炎扩散,中国决定对疫情的“
[法新社巴黎3月6日电]它们和生命本身一样古老,但科学家无法确定它们是否是活的.它们被写进我们的DNA,通过突变和恢复力影响人类历史进程.rn我们每天接触数以亿计的它们.在新
该文分析了国内外的发展趋势,并在现有国产激光器件水平的基础上,探讨了增大激光能量、压缩脉冲宽度、提高峰值功率的技术方案,设计了纳秒级上升沿高压脉冲加压式Q开关电路,
2,3-氧化鲨烯环化酶(2,3-oxidosqualene cyclase,OSC)以2,3-氧化鲨烯(2,3-oxidosqualene)为底物催化合成具有不同母环结构的甾醇或三萜骨架,这些化合物再经过一系列反应生成
二十世纪六十年代,Gallagher在其博士论文中提出LDPC码,从此开始了人们对该码数十年的研究。LDPC码的译码器是设计的难点,因此不断有新的译码算法被提出。其中,分层译码算法
CP A是从常见中药中分离得到的环肽类化合物,前期研究发现该化合物具有一定的体内抗肿瘤活性,但免疫调节活性未见报道。在本文的第一章第一节,我们研究了CP A对三硝基苯磺酸导致