【摘 要】
:
以维吾尔语为例研究自然语料缺乏的民族语言连续语音识别方法。采用HTK通过人工标注的少量语料生成种子模型,引导大语音数据构建声学模型,利用palmkit工具生成统计语言模型,
【机 构】
:
新疆大学信息科学与工程学院,新疆大学多语种信息技术重点实验室
【基金项目】
:
国家自然科学基金资助面上项目(2011211A012,60863008), 新疆维吾尔自治区科技支疆基金资助项目(201091106), 博士启动基金资助项目(BS090144)
论文部分内容阅读
以维吾尔语为例研究自然语料缺乏的民族语言连续语音识别方法。采用HTK通过人工标注的少量语料生成种子模型,引导大语音数据构建声学模型,利用palmkit工具生成统计语言模型,以Julius工具实现连续语音识别。实验用64个维语母语者自由发话的6 400个短句语音建立单音素声学模型,由100 MB文本、6万词词典生成基于词类的3-gram语言模型,测试结果表明,该方法的识别率为72.5%,比单用HTK提高4.2个百分点。
其他文献
我国是一个多民族国家,少数民族高等教育是我国高等教育的重要组成部分。建国40多年以来。特别是改革开放以来,我国少数民族高等教育在整个教育体系中已形成自身体系和特色,
本组选择我院2001年3月至2005年10月腹部闭合性损伤病例中,经过手术治疗证实为单纯性肠系膜撕裂伤病例,共14例,对其进行回顾性分析,总结报告如下:……
在上海鲁迅纪念馆的陈列室内,陈列着鲁迅手书《海上述林》上卷赠书名单。但陈列的名单手迹并非原件,而是一份人工仿制的复制品,由于墨迹逼真,使人难辩真伪,以致有些同志误认
企业要在激烈竞争的市场中立于不败之地,建立一支忠诚的员工队伍是关键,本文就如何使员工忠诚于企业进行了探讨.
孟子是儒家学派的主要代表人物之一。也是我国战国时代著名的思想家、教育家和散文家。他的散文思想深邃,逻辑性强,文锋犀利、析理精当,善用譬喻、富于气势,而且文彩华赡,妙
网页中存在正文信息以及与正文无关的信息,无关信息的存在对Web页面的分类、存储及检索等带来负面的影响。为降低无关信息的影响,从网页的结构特征和文本特征出发,提出一种结合
1982年7月,美籍华人作家董鼎山应中国出版工作者协会之邀,由他的弟弟董乐山陪同自京来沪访问。董氏兄弟为我三四十年的老明友。在沪期间,我以上海出版工作者协会代表的身份接
《巴黎公社图画故事》,一九三一年美国约翰·里德社编,三十二开本,淡米黄封面,上印英文黑字书名'巴黎公社图画故事',威廉·西格尔作。封里有法文'公社万
社会转型期,我国原有的处于主导地位的集体主义价值观念受到了挑战,论文针对其价值整合力及权威性降低的状况,重新解读了西方个人主义价值导向的合理因素和我国传统的集体主
政治制度、法律传统不同的各国,其证人制度也存在着较大差别。对不同国家的证人制度进行比较研究,有利于借鉴国外立法精华,完善我国的证人制度。本文针对证人的资格与范围、