基于转换的错误学习方法的汉语词性自动标注研究

来源 :中国中文信息学会二十周年学术会议 | 被引量 : 0次 | 上传用户：xzyn

【摘要】

：

词性标注是自然语言处理的基础.本文采用了基于规则与统计相结合的标注方法.首先用基于词性与词相结合的三元统计模型对汉语分词及标注进行一体化处理,完成对语料库的初始标

【作者】

：

张艳;徐波;

【机构】

：

中国科学院自动化所模式识别国家重点实验室(北京)

【出处】

：

中国中文信息学会二十周年学术会议

【发表日期】

：

2001年期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

词性标注是自然语言处理的基础.本文采用了基于规则与统计相结合的标注方法.首先用基于词性与词相结合的三元统计模型对汉语分词及标注进行一体化处理,完成对语料库的初始标注;然后用Brill的基于转换的学习方法通过转换规则完成最终的词性标注.对大规模真实语料的标注实验表明基于转换的方法与三元统计模型方法相得益彰;高起始点的初始标注对于提高Brill方法的准确性至关重要;Brill的基于转换的方法在高精度的初始标注的基础上又有明显的提高.

其他文献

浅析生态旅游与乡镇规划的融合--以城口县东安乡修建详细规划为例

“乡土意”承载了城口大巴山自然环境和人文环境的原生基因，是最为典型的聚落灵魂。大巴山的“乡土意”即为奇特、清丽的原生态森林风貌，又有雄浑、古朴的民俗风情，两者在对比中

期刊

重庆生态旅游规划

浅论民用建筑设计项目的计划管理

随着我国经济的快速发展，我国的建筑业也在快速的发展，我国民用建筑的规模也越来越大。本文对民用建筑设计项目计划管理的概念和特点进行简要论述，并简要论述一般民用建筑设计项

期刊

民用建筑涉及项目计划管理

浅析我国城市控制性详细规划单元规划发展实践与探索

通过对我国城市规划体系层次的分析，着重介绍了控制性详细规划单元规划的产生背景、规划层级和重点内容，并通过分析北京、上海等地的“单元规划”实践，对“单元规划”实践过程中

期刊

控制性详细规划单元规划城市总体规划控制性详细规划规划体系

中文输入法的“傻瓜”境界——《智能手机码》简介

本文介绍的智能手机码具有易学性和智能化.编码设计和软件操作均很简单,上手能用.另外它采用中文语言模型技术,实现整句输入.

会议

中文输入法境界智能化语言模型编码设计易学性手机码软件技术操作

地铁隧道盾构施工常见风险及规避对策

因为盾构隧道施工工艺较为复杂，且涉及的环境问题比较复杂，使得盾构施工存在大量风险，若处置不当，将产生灾难性的后果。因此，有必要在隧道盾构施工中全面考虑其施工风险状况，采用科

期刊

遥感技术在地籍测绘中的应用

目前,由于遥感技术在我国地籍测绘中的应用时间相较国外来说比较短,还有许多不尽人意的地方.我们应该将成熟的测绘技术与遥感技术进行对比,找出遥感技术的缺陷和不足之处,对

期刊

遥感技术地籍测绘应用

全信息标注语料库的开发与应用

2000年我们和德国Konstanz工业技术大学国际术语和应用语言学研究中心合作开发了全信息标注语料库.该语料库包含被标注的汉语词语8000个.这是迄今为止我们见到的首次标注全信

会议

全信息标注语料库应用语言学开发与应用语料校对研究中心合作开发汉语词语工业技术术语德国大学

双层呼吸式幕墙的分析--以某办公建筑为例

目前，玻璃幕墙已经成为现代建筑广泛采用的墙体形式，作为一种特殊的围护结构，具有传统墙体不具有的特点。本文结合某办公建筑为例，对双层呼吸式幕墙的设计要点及节能进行分析。

期刊

办公建筑双层呼吸式幕墙节能

信息技术领域术语自动提取和动态更新研究

本文主要讨论信息技术领域的术语自动提取和动态更新研究.分析了人类知识总框架(GFHK)的概念,在此基础上提出信息技术领域知识体系的初步构想,以此作为信息技术领域术语自动

会议

术语信息技术动态更新知识体系

自动控制技术发展趋势分析

社会的进步和经济的发展逐步解放了生产力,自动控制技术成为现代社会发展的标志.在经历了人工、半人工的进展史,具有高效率、低人力的自动化技术成为现代工业生产的新宠.本文

期刊

自动控制技术发展趋势

基于转换的错误学习方法的汉语词性自动标注研究

其他学术论文