相似词获取的集成方法

来源 :第十一届全国计算语言学学术会议 | 被引量 : 0次 | 上传用户:guanyucomputer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义相似度计算是自然语言处理领域的关键问题之一,在信息检索中的查询扩展、机器翻译中的模块识别,以及句法分析、词义消歧等任务中都发挥着重要的作用.本文将集成方法应用子基于大规模语料库的汉语语义相似度计算上,提出并实现了不同语域的集成方案.分别使用新闻语料和互联网语料,选取窗口大小为2或3的上下文词语特征、以上下文与目标词之间的互信息作为权值构建特征向量,计算向量之间的cosine夹角作为词语相似度,得到了三种语义相似度序列.对这三个相似度序列进行集成,使用了平均排名、调和平均排名和平均分数三种集成方法.对四种组合方式的集成结果进行了评测,实验结果表明,集成方法获取的语义相似度相对于单一方法准确率得到了提升,其中,与不同窗口的集成相比,本文提出的不同语域的集成,准确率提升更为显著.
其他文献
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
为解决采煤机齿轮参数计算查询繁琐、容易出错的问题,开发了一种程序化参数计算软件.该软件以VB.NET为开发语言,Excel为数据存储技术开发,具有参数快速计算、方便存储、容易
砂岩裂隙分布规律性不强,煤矿砂岩裂隙水大多呈现出不均衡性、集中性的“点式”涌水特征.针对唐家河煤矿1#煤层底板砂岩倾角大、承压裂隙水压力高、富水性强,给矿井开拓及开
近年来,学者们在面向信息处理的蒙古语语义研究方面做过不少的探索,前面向信息处理的语义研究对于蒙古语动词、名词、形容词的内部语义关系,动词与名词、名词与名词、名词与形容
会议
近年来,本体被广泛应用于信息集成、智能信息检索、自然语言处理等领域,本文研究了一种基于多特征表示的本体概念挂载方法.以中国大百科知识体系**作为本体体系结构,抽取网络知
住房公积金制度推行10多年,中低收入者的“购房难”并未明显缓解,反而被质疑日益滑向了实际操作中的“济富”    今年5月世界银行发布的一份《中国经济分析报告》中指出,中国城镇实行的住房公积金,可以用来为中低收入群体提供能承受的住房融资,但主要是使收入较高的家庭受益,大部分非正规就业或失业的中低收入者无法参加公积金,实际从中受益的群体,是城镇人口的一小部分。    公积金贷款为何被收紧    9月4
2008年11月上旬,“三晋国家历史文化名城老年书画联展”在代县展出。代县老年书画研究会根据代县一本《摄影集》的前言复印了代县的历史简介,分发于大同、平遥、祁县、新绛县
应用X射线荧光光谱仪(XRF)研究了不同温度(120℃、400℃、600℃)提质后的粉化褐煤中主要成灰元素的梯度分配特性.结果表明:Si、Al元素含量随粒度级的减小而降低,不易向粉化产
管幕施工会对管道周围的土体产生扰动,引起土体移动。分析了管幕施工的地面变形机理,对顶管施工引起的地面变形计算方法的发展概况及研究进展进行了综述,将地面变形计算方法
领域本体是表达领域概念及概念间关系的知识集合,在知识共享、信息检索等方面有着重要的应用价值。目前领域本体的构建方法主要分为手工构建、全自动构建和半自动构建,其中半自
会议