基于中心化相似度矩阵的词向量方法 - 论文文献免费下载 - 皮皮文库

基于中心化相似度矩阵的词向量方法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户：Monking

【摘要】

：

词向量使用低维稠密向量表示词，通过向量运算能够反映词间关系，被广泛应用于自然语言处理任务。对基于矩阵分解的词向量方法进行了研究，发现降维前相似度矩阵质量与词向量质量存在线性相关性，提出了一种基于中心化相似度矩阵的方法。该方法使得相似（不相似或弱相似）词间的相似程度相对增强（减弱）。在WS-353和RW数据集的词语相似性实验中验证了所提出方法的有效性，两个数据集下词向量质量最高提升0.2896和0.1801。中心化能够提升降维前相似度矩阵质量，进而提升词向量质量。

【作者】

：

徐帆王裴岩蔡东风

【机构】

：

沈阳航空航天大学人机智能研究中心;

【出处】

：

计算机应用研究

【发表日期】

：

2019年02期

【关键词】

：

词向量中心化相似度矩阵

【基金项目】

：

辽宁省自然科学基金计划重点项目(20170540705);国家自然科学基金资助项目(61403262)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

词向量使用低维稠密向量表示词，通过向量运算能够反映词间关系，被广泛应用于自然语言处理任务。对基于矩阵分解的词向量方法进行了研究，发现降维前相似度矩阵质量与词向量质量存在线性相关性，提出了一种基于中心化相似度矩阵的方法。该方法使得相似（不相似或弱相似）词间的相似程度相对增强（减弱）。在WS-353和RW数据集的词语相似性实验中验证了所提出方法的有效性，两个数据集下词向量质量最高提升0.2896和0.1801。中心化能够提升降维前相似度矩阵质量，进而提升词向量质量。

其他文献

北京市长安公证处对2012年北京国安足球俱乐部球迷年票电脑摇号活动进行现场监督公证

<正>2012年1月8日,对于北京国安球迷来说是个值得期待的日子,因为国安足球俱乐部年票将在这一天通过电脑摇号的方式产生。通过电脑抽号产生年票对于北京国安足球俱乐部尚属首

期刊

北京国安公证处现场监督北京市

产生多维随机变量值的脆弱模型法

利用数学中的概率积分变换及脆弱模型思想来得到实际问题中出现的多维随机变量值的选取方法。

期刊

概率积分变换随机数脆弱模型

以树轮宽度重建九寨沟1750年以来冬半年平均最低温度

利用四川九寨沟地区树轮宽度年表对该地区1750A．D．以来的冬半年（上年11月到当年3月）平均最低温度进行模拟重建，重建方程的方差解释量为46．2％（调整自由度后为45．1％）。结果表明，九寨沟地区

期刊

九寨沟树木年轮宽度冬半年平均最低温度

广州总体发展概念规划的背景、要点与展望

在分析广州城市人口、经济、社会等方面情况的基础上，广州总体发展概念规划提出了“东进、南拓、北优、西联”的城市发展思路，并针对广州城市长远发展的挑战，提出了“规划移民城

期刊

城市发展概念规划广州市

加强石油企业财务内部控制审计的途径

随着社会经济的不断发展,为了能够有效把控企业财务内部控制的科学性,需要我们不断的完善自身内部控制制度,建立有效的企业财务内部控制审计机制,从而提升企业财务的管理水平

期刊

石油企业财务管控内部控制审计途径分析

《伤寒论》心阳虚从脾论治钩玄

期刊

《伤寒论》心阳虚补脾法心脾相关

分段式健康教育在心脏起搏器手术病人中的应用

人工心脏起搏器是通过人工心脏起搏器或程序刺激器发放人造脉冲、电流刺激心脏以带动起搏的治疗方法。随着心脏起搏技术的不断发展和临床的广泛应用，起搏器的治疗已日臻成熟，接

期刊

心脏起搏器手术病人老年病人健康教育分段式

蒙古人民的装饰艺术

蒙古人民所创作的红火的民间图案艺术作品,带来了蒙古人民对我国人民炽热的友情与良好的祝愿。这些豪迈、乐观而又富有生活气息的作品,给我们留下了难忘的印象。德·玛尼巴

期刊

持续性异位妊娠最佳治疗方法的研究

目的：探讨持续性异位妊娠（PEP）的最佳治疗方法。方法：对155例PEP患者随机采用3种不同治疗方法：A组期待疗法;B组甲氨蝶呤（MTX）局部注射治疗;C组MTX加米非司酮全身用药。对3组治疗成功

期刊

持续性异位妊娠期待疗法局部注射治疗全身用药治疗甲氨蝶呤

基于行为模式的安卓恶意软件静态检测深度学习算法的研究

安卓操作系统的开放性使得其成为目前世界上最流行的智能手机操作系统,然而这种开放性也吸引了很多黑客开发安装恶意软件。这些恶意软件以资费消耗、隐私窃取、恶意扣费、远

学位

安卓恶意软件行为模式静态检测神经网络

其他学术论文