基于词向量的藏文语义相似词知识库构建

来源 :第十八届中国计算语言学大会暨中国中文信息学会2019学术年会 | 被引量 : 0次 | 上传用户：shishuhu45

【摘要】

：

　　词向量在自然语言处理研究的各个领域发挥着重要作用。该文从语言学角度出发，讨论了词向量技术与语言学理论的关系；根据词向量的特征，提出利用藏文词向量构建语义相似词知识

【作者】

：

龙从军刘汇丹周毛克

【机构】

：

中国社会科学院民族学与人类学研究所,北京,100081;中国社会科学院大学,北京100081中国科学院软件研究所,北京100083中国社会科学院大学,北京100081

【出处】

：

第十八届中国计算语言学大会暨中国中文信息学会2019学术年会

【发表日期】

：

2019年10期

【关键词】

：

词向量藏文语义相似词

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　词向量在自然语言处理研究的各个领域发挥着重要作用。该文从语言学角度出发，讨论了词向量技术与语言学理论的关系；根据词向量的特征，提出利用藏文词向量构建语义相似词知识库。作者以哈尔滨工业大学的中文《词林》为基础，通过汉藏双语词典对译，在获取对译词的词向量的基础上，计算对译词的词向量与原子词群平均词向量的差值，利用不同的差值，自动筛选出与原子词群语义相似度较小的词。作者分别以藏文的词和音节为单位计算词向量，自动筛出不属于原子词群的词；自动筛选结果与人工筛选结果对比，发现两者具有较高的一致性，说明词向量计算结果与人的语言直觉具有较高的一致性。因此本文所采用的方法有助于提高藏文语义相似词知识库构建效率。

其他文献

推进联合行动,实现毛纺行业的可持续性与包容性

会议

纤维复合材料的增强机理与失效原因

会议

纤维增强板材标准技术要求及检测现状

会议

纤维水泥板常见质量问题的原因分析和解决办法

会议

羊毛生命周期评估的进程

会议

造就羊毛的时尚未来

会议

纤维水泥的涂装为建筑时尚增添新元素

会议

“经营流域”的第三届水利发展研究学术周实践探索与理论思考

　　流域综合治理是流域综合管理的重要抓手。长期以来，流域综合治理在资源开发、生态保护、环境改善等方面取得了显著成效。但随着我国经济结构调整和财政收入增速放缓，一直以

会议

流域经营资源整合市场化

人脑如何学习新的语言规则

　　人脑究竟能否掌握新的语言规则,这是语言学习研究领域一直争议的问题。习得年龄、输入量和相似性,哪个才是影响语言规则学习的重要因素？学界始终没有统一的结论。本研究以

会议

人工语法小数据无监督学习输入量事件相关电位技术

Laser-GMA-Hybrid Welding for Industrial Applications

　　In view of the demands made by the end users in the field of application of vehicle construction for an ever-higher product quality and improved performance

会议

基于词向量的藏文语义相似词知识库构建

其他学术论文