基于统计和规则的常用词的兼类识别研究

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户：redfox1234

【摘要】

：

词的兼类问题是汉语词性标注中的关键问题之一。针对常用词的兼类识别进行研究，综合考虑了影响兼类词识别的不同特征，分别使用条件随机场模型、最大熵模型和k最近邻等统计方法，

【作者】

：

夏静柴玉梅昝红英

【机构】

：

郑州大学信息工程学院

【出处】

：

计算机工程与设计

【发表日期】

：

2013年2期

【关键词】

：

中文信息处理兼类词条件随机场最大熵 K近邻 Chinese information processing multi-category word co

【基金项目】

：

国家自然科学基金项目（60970083）,模式识别国家重点实验室开放课题基金项目,河南省科技创新人才杰出青年基金项目（104100510026）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

词的兼类问题是汉语词性标注中的关键问题之一。针对常用词的兼类识别进行研究，综合考虑了影响兼类词识别的不同特征，分别使用条件随机场模型、最大熵模型和k最近邻等统计方法，根据兼类词本身的特点以及其在上下文句子中的关系，同时针对不同的方法采用词语信息、词性信息等不同的特征模板分别对训练语料进行特征抽取，并取得了较好的实验结果；对一些识别结果不够理想的词又尝试了规则的方法，构建兼类词的规则，不断进行测试，改进规则库，在相同的条件下，得到了优于统计方法的实验结果。

其他文献

书山有路“趣”为径学海无涯“乐”作舟——浅谈高中生物趣味性教学的策略

我国古代伟大的教育家孔子说过：“知之者不如好知者,好知者不如乐之者。”兴趣是人们最好的老师,是学生学习知识、实践创新的内驱力和催化剂。高中生物学是一门贴近生活,揭示

期刊

高中生物学趣味性教学“乐”“趣”学科知识体系高中生物课学习知识

教师，留声机？——读丰子恺漫画（二）

教师既是在复杂的知性实践中寻求高度反思与判断的“专家”，也是通过经验积累练就了经验与智慧、践行教育实践的“工匠”。上次与大家分享了丰子恺先生“教育”漫画二则，今天再

期刊

丰子恺漫画留声机教师教育实践经验积累“专家”知识分子讲台

挖掘生活化内容优化课堂教学设计——小学科学课堂教学设计优化策略

小学科学课程与学生生活息息相关，学生科学素质培养需要拓展教学维度。对科学教材进行深度挖掘，关注学生校园生活，搜索社会生活相关资源信息，围绕家庭生活展开探索，为学生创设适宜

期刊

课堂教学设计小学科学课程深度挖掘生活化优化策略学生生活内容科学素质培养

哲学的综合功能和哲学发展的生长点

【正】在探寻哲学发展的突破口和生长点的过程中,讨论一下哲学的功能问题,也许不无裨益。苏联一些学者认为哲学具有整合或综合的功能、广义的批评(分析、研究)

期刊

哲学探索哲学发展综合功能生长点方法论功能哲学工作者突破口功能理解价值论横断科学

略论黄道周抗清

【正】抗清是黄道周末年的重要活动,也是今人评论黄道周的主要方面。有的论者誉之过高。笔者拟以几点粗浅之见就教于方家。一、其抗清态度并非积极黄道周于天启二年中进士,

期刊

黄道周抗清斗争山东地区隆武帝郑芝龙翰林院明朝后金职责范围十七年

太原市珠算心算协会第五届二次常务理事扩大会议顺利召开

2011年3月26日，太原市珠算心算协会第五届二次常务理事扩大会议在会计大厦召开。来自各县（市、区）、市直有关部门和学校的52名常务理事、理事参加了会议。

期刊

理事扩大会议太原市协会心算珠算常务理事

小学生课外阅读差异化指导的四个“关注”

新课标强调,教师要尊重学生的人格,满足不同学生的学习需求,要求在推行课外阅读的时候既面向全体学生,又要注重发展学生的个性特长。一、关注＂学情＂——切实推荐合宜的读物教师

期刊

学生课外阅读学习水平个性特长人教版花钟阅读难度学习效果阅读教学组间同质组内异质

新《事业单位财务规则》探析——基于财务管理改革视角

财政部对1997年实施的《事业单位财务规则》（以下简称《规则》）进行修订，自2012年4月1日起施行，这对事业单位财务管理改革具有重要的意义。文章基于财务管理改革视角关注新《规则

期刊

事业单位财务规则财务管理改革

文学研究应借助于文化热潮的推动

【正】当前正在中国兴起的文化研究热潮,对整个文坛,尤其是对文学批评、文学理论研究有什么意义?我的直感是:文化热潮的酝酿与日益繁盛和文学的成熟与文学研究的深化是同质

期刊

文学研究文化研究研究热潮文化热潮文学理论研究文化寻根文学批评新动向本质特征人类

说话人识别中改进特征提取算法的研究

为了提取到能够区分不同说话人个性特征的最优特征参数,采用在Mel频率倒谱系数(Mel-frequency cepstrum coefficients,MFCC)基础上进行改进的复合参数,即增加归一化短时能量参数和一阶差分所构成的特征矢量作为特征。针对高维特征参数,提出了一种基于相关距离Fisher准则的特征选取方法,利用该方法对提取出的参数进行加权降维。通过实验对比结果表明,该算法提高了识别率,具

期刊

说话人识别特征提取归一化短时能量梅尔倒谱复合参数相关距离Fisher准则speaker recognition feature extraction

基于统计和规则的常用词的兼类识别研究

其他学术论文