基于词向量的藏文语义相似词知识库构建

来源 :第十八届中国计算语言学大会暨中国中文信息学会2019学术年会 | 被引量 : 0次 | 上传用户:shishuhu45
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  词向量在自然语言处理研究的各个领域发挥着重要作用。该文从语言学角度出发,讨论了词向量技术与语言学理论的关系;根据词向量的特征,提出利用藏文词向量构建语义相似词知识库。作者以哈尔滨工业大学的中文《词林》为基础,通过汉藏双语词典对译,在获取对译词的词向量的基础上,计算对译词的词向量与原子词群平均词向量的差值,利用不同的差值,自动筛选出与原子词群语义相似度较小的词。作者分别以藏文的词和音节为单位计算词向量,自动筛出不属于原子词群的词;自动筛选结果与人工筛选结果对比,发现两者具有较高的一致性,说明词向量计算结果与人的语言直觉具有较高的一致性。因此本文所采用的方法有助于提高藏文语义相似词知识库构建效率。
其他文献
会议
会议
会议
会议
会议
会议
会议
  流域综合治理是流域综合管理的重要抓手。长期以来,流域综合治理在资源开发、生态保护、环境改善等方面取得了显著成效。但随着我国经济结构调整和财政收入增速放缓,一直以
  人脑究竟能否掌握新的语言规则,这是语言学习研究领域一直争议的问题。习得年龄、输入量和相似性,哪个才是影响语言规则学习的重要因素?学界始终没有统一的结论。本研究以
  In view of the demands made by the end users in the field of application of vehicle construction for an ever-higher product quality and improved performance
会议