一种基于文本分类的语言模型自适应方法

来源 :863计划智能计算机主题学术会议 | 被引量 : 0次 | 上传用户：njg916

【摘要】

：

本文介绍了一种基于文本分类的语言模型自适应方法.首先.我们用Kullback距离算法将语料文本分类为8个领域,并为每一个领域建立三元语言模型.但试验表明某些领域的语言模型的

【作者】

：

孙甲松崔晓东王作英

【机构】

：

清华大学电子工程系(北京)

【出处】

：

863计划智能计算机主题学术会议

【发表日期】

：

2001年2期

【关键词】

：

语言模型自适应文本分类语音识别系统

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文介绍了一种基于文本分类的语言模型自适应方法.首先.我们用Kullback距离算法将语料文本分类为8个领域,并为每一个领域建立三元语言模型.但试验表明某些领域的语言模型的性能变差.为了解决这个问题,我们试图利用领域语言模型来做语言模型自适应.通过将领域语言模型和综合语言模型进行线性组合,获得了相对于综合语言模型字错误率下降5至9﹪的改进.

其他文献

浅析水利工程混凝土施工技术

这些年来，伴随着我们国家水利工程的不断兴起，水利工程之中的施工技术也在不断的进行混凝土施工技术的，这其中的混凝土施工技术的应用作为水利工程施工中的严格重要的环节，怎样的

期刊

水利工程技术创新混凝土施工技术

基于隐马尔可夫模型的实体名识别

本文针对自然语言处理的特点,使用基于隐马尔可夫模型(HMM)的自学习算法进行实体名识别,并对模型和传统的Viterbi算法作了几项改进,使其整体性能显著提高.本方法显著特点是不

会议

实体名识别隐马尔可夫模型Viterbi算法文本处理

一种结合模糊连接度和FCM的医学图像分割方法

图像分割的一个重要应用领域是医学图像的分割.我们针对医学图像的模糊特点和实际应用的要求,提出一种结合模糊连接度方法和模糊C均值聚类的交互式分割方法.该方法分两个步骤

会议

模糊连接度医学图像图像分割分割方法均值聚类实际应用实验对象冗余特征方法构造准确度类空间聚类法交互式度方法验证兴趣提取二维

红外热成像带电检测技术发现设备缺陷

本文详细介绍一起利用红外热成像带电检测技术发现的隔离开关刀嘴发热危急缺陷，具体介绍了检测、分析、判断及故障处理的过程。

期刊

红外测温隔离开关

城乡建设用地增减挂项目前期摸底调查遇到的问题与对策建议

城乡建设用地增减挂钩政策是国家推出的支持社会主义新农村建设、促进城乡统筹发展、破解保护耕地不突破 18 亿亩的红线与保障城市化、城镇化发展建设用地需求“两难”困境的

期刊

城乡建设用地增减挂钩农村居民点问题与对策

城乡建设用地增减挂钩运作模式的几点思考

自 2006 年城乡建设用地增减挂钩试点开展以来，已经过长达 12 年的探索，随着社会发展及合作模式逐渐改变，政府主导型运作模式、市场主导型运作模式、农村集体自主型运作模式等多

期刊

城乡建设用地增减挂钩运作模式

多功能感知机实验平台——聋人与正常人交流系统1

本文介绍了一个多功能感知机的实验平台,讨论了利用多模式方法处理异质模式交流的问题.这一实验平台集成了手语识别、手语合成、唇读、人脸特征检测、人脸检测与识别以及特定

会议

多模式接口手语识别手语合成人脸识别人脸合成多功能感知机异质模式交流

基于支持向量机的灰度图像中正面人脸检测

研究复杂背景下人检测对于人脸识别等有重要意义.本文提出了一种基于支持向量机(Support Vector Machine,简称SVM)的灰度图像中正面直立人脸检测方法.本方法利用人脸的小波系

会议

人脸检测支持向量机小波灰度图像统计模式识别

联机汉字识别中的在线学习

在线学习在联机汉字识别中有很大的应用价值,它使识别系统能够在识别的同时实时地自动地学习从而更好地适应当前汉字书写特点.在线学习是一种增量式学习.本文设计了一个具有

会议

在线学习增量式学习联机汉字识别记忆因子渐进参数

川西平原山水城市空间形态研究——以都江堰市区为例

各地的城市空间在城市化浪潮中由于地域特色缺失而越来越趋同。山水城市传承了中国传统文化智慧，包含着对城市传统特色的追寻。本文从山水城市空间营造的角度出发，以都江堰市为

期刊

山水城市空间形态都江堰

一种基于文本分类的语言模型自适应方法

其他学术论文