词义排歧的一种语言模型

来源 :语言文字应用 | 被引量 : 0次 | 上传用户:lummi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
《同义词词林》(下简称《词林》)中每个同义词集对应于一个唯一的义类代码。本文的基本假设是 :当这些词在文本中出现时 ,与它们前后同现的那些实词在统计意义上是相似的。初步实验表明 ,尽管根据分布的聚类过程与《词林》编者划分同义词集的机理完全不同 ,对词语进行聚类的结果却和《词林》语义类的平均一致率高达 80 %以上。本研究的意义在于 ,提出一种对语言学家凭语感对词的分类进行定量分析的方法 ,并且为计算机自动词义标注时使用语言学知识奠定了基础。 Each synonym set in “Synonyms Lin” (“Lin”) corresponds to a unique class code. The basic assumption in this paper is that when these words appear in the text, they are statistically similar to those words that come in front of and behind them. The preliminary experiments show that although the clustering process according to the distribution is completely different from that of the “Lin” editor, the average consistency rate between the words and the “Linlin” semantic class is as high as 80% or more. The significance of this study is to propose a method for quantifying the classification of words by linguists on the basis of verbal feeling, and laying a foundation for the use of linguistic knowledge in computer automatic semantic labeling.
其他文献
英国《自然·地球科学》杂志发表文章称,达到《巴黎协定》所定的将升温控制在1.5摄氏度的目标并非不可能。文章指出,根据此目标设定的碳预算,可用的碳排放剩余限额比此前预计
甲骨卜辞中“河”作为祭祀对象,商人对之有较为隆重的祭典。其神性与商族先公有诸多相混之处,分析其神职权能并比较与先公的差别,个人认为,“河”虽然兼备一些祖先神的性质,
广西水电会计学会举行学术报告会本年6月25日,广西水利电力会计学会举行学术报告会.邀请区财政厅副厅长刘铭达作“深化会计改革和整顿会计秩序”的专题报告.区水电厅韩祥麟副厅长、
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
对于邓小平领导的1975年整顿,学术界已经进行了相当充分的讨论。但仍然有若干问题没有取得一致的认识。包括邓小平领导的1975年整顿是不是“全面整顿”?1975年整顿为何突然中
[本刊讯]为了解当前地质调查发展形势、加快科技与地调融合、促进实验测试技术进步,2015年1月8日上午,国家地质实验测试中心在京组织举办了“地质实验测试技术发展趋势分析”
秦川机床集团有限公司是国务院批准的全国百家现代企业制度试点单位之一。试点中,我们进行了积极的探索,将原有的各分厂改革为进一步相对独立,实行独立核算、自负盈亏的经营
<正> 家电中的电气负载,如马达、阀门、灯管或者加热器等,都需要接通或切断输送给它的功率,有些则要求输入功率能够在一定范围内改变。使用双向可控硅(Triac)的固态相位功率
现代古文字领域的研究 ,已走出了宗许和疑古的圈子 ,新古文派用现代语言文字学原理来观察传世文献字书 ,把静态文献资料放入动态的历史发展阶段去认识 ,以考古材料为据 ,结合
垂钓是一种充满情趣的活动。钓手如果能根据各地的不同情况,有针对地自己制作各类钓饵,将更能体现休闲的特点,增加垂钓的乐趣。 2001年龙王恨新款“我也能成为饵料专家”系