词义排歧的一种语言模型

来源 :语言文字应用 | 被引量 : 0次 | 上传用户：lummi

【摘要】

：

《同义词词林》(下简称《词林》)中每个同义词集对应于一个唯一的义类代码。本文的基本假设是 :当这些词在文本中出现时 ,与它们前后同现的那些实词在统计意义上是相似的。初

【作者】

：

黄昌宁李涓子

【机构】

：

微软中国研究院!北京100080,清华大学智能技术与系统国家实验室!100084

【出处】

：

语言文字应用

【发表日期】

：

2000年03期

【关键词】

：

词林词义词义排歧语言模型语言学知识同义词词林自动词语义类初步实验语料库

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

《同义词词林》(下简称《词林》)中每个同义词集对应于一个唯一的义类代码。本文的基本假设是 :当这些词在文本中出现时 ,与它们前后同现的那些实词在统计意义上是相似的。初步实验表明 ,尽管根据分布的聚类过程与《词林》编者划分同义词集的机理完全不同 ,对词语进行聚类的结果却和《词林》语义类的平均一致率高达 80 %以上。本研究的意义在于 ,提出一种对语言学家凭语感对词的分类进行定量分析的方法 ,并且为计算机自动词义标注时使用语言学知识奠定了基础。 Each synonym set in “Synonyms Lin” (“Lin”) corresponds to a unique class code. The basic assumption in this paper is that when these words appear in the text, they are statistically similar to those words that come in front of and behind them. The preliminary experiments show that although the clustering process according to the distribution is completely different from that of the “Lin” editor, the average consistency rate between the words and the “Linlin” semantic class is as high as 80% or more. The significance of this study is to propose a method for quantifying the classification of words by linguists on the basis of verbal feeling, and laying a foundation for the use of linguistic knowledge in computer automatic semantic labeling.

其他文献

《自然》称碳排放达到《巴黎协定》目标并非不可能

英国《自然·地球科学》杂志发表文章称,达到《巴黎协定》所定的将升温控制在1.5摄氏度的目标并非不可能。文章指出,根据此目标设定的碳预算,可用的碳排放剩余限额比此前预计

期刊

巴黎协定碳排放地球科学气候变化目标设定全球平均气温表面温度中期全球变暖国际气候

论殷卜辞中“河”的自然神属性

甲骨卜辞中“河”作为祭祀对象,商人对之有较为隆重的祭典。其神性与商族先公有诸多相混之处,分析其神职权能并比较与先公的差别,个人认为,“河”虽然兼备一些祖先神的性质,

期刊

自然神祖先神商族王亥于岳商王朝殷人上甲人涉卬否辞例

广西水电会计学会举行学术报告会

广西水电会计学会举行学术报告会本年６月２５日，广西水利电力会计学会举行学术报告会．邀请区财政厅副厅长刘铭达作“深化会计改革和整顿会计秩序”的专题报告．区水电厅韩祥麟副厅长、

期刊

会计学会学术报告会财政厅副厅长会计秩序会计改革水利电力专题报告韩祥刘铭学会理事

日本书刊常用抗生素的英文缩写及其日文假名拼音介绍(续)

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

假名缩写抗生素双去氧卡那霉素夕沙抗生英文柱晶白霉素氯四环素甲烯土霉素

关于邓小平领导1975年整顿若干问题的探讨

对于邓小平领导的1975年整顿,学术界已经进行了相当充分的讨论。但仍然有若干问题没有取得一致的认识。包括邓小平领导的1975年整顿是不是“全面整顿”?1975年整顿为何突然中

期刊

“全面整顿”1975年整顿历史地位三项指示为纲《邓小平文选》王洪文毛远新汇报提纲十一届三中全会出版说明

地质实验测试技术发展趋势分析研讨培训班在京召开

[本刊讯]为了解当前地质调查发展形势、加快科技与地调融合、促进实验测试技术进步,2015年1月8日上午,国家地质实验测试中心在京组织举办了“地质实验测试技术发展趋势分析”

期刊

地质实验测试技术发展地质调查规划部署全面深化改革能源安全测试中心测试技术趋势分析院党委书记

关于建立现代企业制度财务管理模式的探索

秦川机床集团有限公司是国务院批准的全国百家现代企业制度试点单位之一。试点中,我们进行了积极的探索,将原有的各分厂改革为进一步相对独立,实行独立核算、自负盈亏的经营

期刊

财务管理集团化经营内部银行现代企业制度公司开户银行财务与会计结算中心财会工作资金筹集公司主导产品

家电用三象限双向可控硅

<正> 家电中的电气负载,如马达、阀门、灯管或者加热器等,都需要接通或切断输送给它的功率,有些则要求输入功率能够在一定范围内改变。使用双向可控硅(Triac)的固态相位功率

期刊

双向可控硅

中国古文字学和《说文》的科学研究——兼论《〈说文解字〉与中国古文字》研究的新途径及学术贡献

现代古文字领域的研究 ,已走出了宗许和疑古的圈子 ,新古文派用现代语言文字学原理来观察传世文献字书 ,把静态文献资料放入动态的历史发展阶段去认识 ,以考古材料为据 ,结合

期刊

考古材料古文字学六书语言文字学说文解字疑古形符古代文化周礼网络系统

自制钓饵别有情趣

垂钓是一种充满情趣的活动。钓手如果能根据各地的不同情况,有针对地自己制作各类钓饵,将更能体现休闲的特点,增加垂钓的乐趣。 2001年龙王恨新款“我也能成为饵料专家”系

期刊

王恨草毒蛋白纤维阿魏一龙里米蒜素

词义排歧的一种语言模型

其他学术论文