利用汉字二元语法关系解决汉语自动分词中的交集型歧义

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户：ywyyang

【摘要】

：

本文提出了一种利用句内相邻字之间的互信息及ｔ－测试差这两个统计量解决汉语自动分词中交集型歧义切分字段的方法．汉字二元语法关系（ｂｉｇｒａｍ）为相关计算的基础，直接从生语料库中自动习得．初

【作者】

：

孙茂松黄昌宁邹嘉彦陆方沈达阳

【机构】

：

清华大学计算机科学与技术系,香港城市大学语言资讯科学研究中心

【出处】

：

计算机研究与发展

【发表日期】

：

1997年05期

【关键词】

：

汉语自动分词二元语法汉字集统计量分词系统训练样本匹配法中文信息处理字串分析算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文提出了一种利用句内相邻字之间的互信息及ｔ－测试差这两个统计量解决汉语自动分词中交集型歧义切分字段的方法．汉字二元语法关系（ｂｉｇｒａｍ）为相关计算的基础，直接从生语料库中自动习得．初步的实验结果显示，可以正确处理９０．３％的交集字段 In this paper, we propose a method that uses the two statistics of mutual information and t-test differences between adjacent words in a sentence to solve the cross-disambiguated segmentation in Chinese automatic word segmentation. The bigram of Chinese characters is the basis for related calculations and is automatically learned directly from the corpus. Preliminary experimental results show that 90.3% of the intersection fields can be correctly processed

其他文献

假帐,不能再继续做下去了!

一、做假帐的根源为什么近几年来做假帐的单位越来越多,金额越来越大呢?笔者认为,产生的主要根源有二:一是社会根源,二是思想根源。社会根源突出表现在党风不正,有法不依,执

期刊

假帐风不正法纪观念企业利益国家利益主管会计会计员以权谋私会计主管人员打击报复

我国机床行业进口技术溢出效应研究

进口先进的中间投入品和资本品是发展中国家企业获得技术溢出的重要渠道。本文利用中国机床行业微观层面的数据，考察了进口技术溢出效应的存在性及其影响机制。实证结果显示，机床行业存在进口技术溢出效应，并且只有进口强度达到某一门槛之上时，进口才能促进企业层面生产率的改善；进口对企业层面全要素生产率的影响依赖于企业的生产率水平，进口对那些生产率水平较高、学习和吸收能力较强的企业具有更强的促进作用。在改变生产率测度方法，以及采用一阶段方法论的情况下，研究结论均表现出较强的稳健性。作为扩展性研究，本文进一步将反映企业累积

期刊

机床产品内国际分工企业进口技术溢出效应生产率生产率水平机床行业企业生产率国际分工中间投入品

中华人民共和国财政部关于加强会计改革宣传工作的通知

各省、自治区、直辖市、计划单列市财政厅(局),国务院各部、委、局,总公司: 进一步深化会计改革,是当前会计工作的首要任务。为了配合和促进会计改革的顺利进行,提高社会各

期刊

会计改革宣传工作会计工作会计工作者会计事务会计人员管理单位会计工作南巡讲话会计师会计核算制度

对高职院校专业基础课教学质量的探讨

提高高等农林职业院校专业基础课的教学质量是广大教师亟待解决的重要课题。提高专业基础课教学质量的措施与方法是:重视师资队伍的建设、精良教材的选用、加强课堂教学互动

期刊

专业基础课教学开放式实验教学科研训练高职院校课堂教学互动生产实践活动教学工作农业生产植物生理学知识的理解

超声弹性成像、常规超声与钼靶X线在乳腺肿瘤诊断中的价值

目的探讨超声弹性成像、常规超声与钼靶X线诊断乳腺肿瘤的价值。方法回顾分析2010年6月—2013年6月经手术病理证实的235例乳腺肿瘤患者（288个病灶）,分别分析超声弹性成像、常规

期刊

钼靶超声弹性成像乳腺肿瘤诊断常规超声超声钼靶X线常规超声诊断乳腺准确性弹性成像

明代的舞蹈

明代是我国乐舞艺术发生激烈变化的时代,本文试就明代的舞蹈艺术(主要论述汉民族)及其对后世的影响作初步探讨。一、明代的戏曲舞蹈和民间舞蹈我国的戏曲是迄今舞台表演艺术

期刊

海神庙陶庵梦忆浣纱记王魁梁辰鱼敫桂英艺术形式成茂林缓带刻画人物

交通财会专业教材编写工作座谈会在上海召开

交通部财会司委托中国交通会计学会主持召开的“交通财会专业教材编写工作座谈会”于10月11日至13日在上海举行。财会司司长朱耀庭、中国交通会计学会副会长兼秘书长陈守白、

期刊

财会专业教材编写交通运输企业会计教学改革财会教学财会会计工作会计师教材编审国际会计

通俗剧要讲究叙述艺术

电视剧主要是一种家庭消费艺术,受播放条件、观看方式等多种因素影响,它更强调通过时间的延续、信息的反复刺激、情节的曲折变化和人物的命运变迁来吸引观众。因而,电视连续

期刊

剧中人物观看方式播出时间家庭消费观众心理现实矛盾创作规律叙事结构运动感叙事节奏

谈会计准则与当前会计改革——在中国交通会计学会二届二次理事会暨学术研讨会上的发言

藉这次研讨会的机会,介绍财政部最近召开的会计准则和会计改革研讨会的内容以及个人对会计改革的一些肤浅的认识。一、当前会计改革面临的形势和任务随着经济体制改革的不

期刊

会计改革会计制度现行会计制度行业会计制度借贷记帐法会计平衡公式资本金制度中国会计准则完全成本法会计基本准则

刨花模压制品表面装饰材料实验研究

刨花模压制品是一次加工成型,模型变化大,主要指带有一定的弧度。鉴于这种情况,我们必须对装饰材料进行改性。 1 装饰纸浸渍液改性刨花模压制品形状复杂,具有不同程度的

期刊

刨花模压制品表面装饰浸渍液树脂固化装饰材料装饰纸弯曲度热压压力热压温度浸渍纸

利用汉字二元语法关系解决汉语自动分词中的交集型歧义

其他学术论文