基于术语同义关系的文档相似度研究

来源 :河北大学学报:自然科学版 | 被引量 : 0次 | 上传用户:super8516
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于向量空间的文档相似度算法假设特征元素间关系为正交,当2篇文档采用了具有相近语义的不同术语描述时,该方法不能准确反映二者的相似性.针对这种情况,文章利用词语的同义关系,在给出术语与术语组相似度、术语组和术语组间相似度的概念及算法的基础上,给出一种基于词语相似关系的文档相似度计算方法.实验采用科技文献类文档和新闻报道类文档作为测试集合,比较新方法和向量空间算法的分类性能,结果显示新方法可提高文档分类的准确性.
其他文献
摘 要:转喻不仅仅是常见的语言现象,也是人们认识事物的一种重要思维方式和行为方式。用凸显、易感知、易记忆、易辨认的部分代替整体或其他部分,以山东地名为例探讨转喻在地名命名中的认知语用理据,能帮助我们解读到当地的文化和居民的心理特征,从中找出某些规律,以便我们能够全面地理解转喻的本质,更好地运用到学习和日常交际中去。  关键词:转喻;认知;地名;命名;  文章编号:978-7-80736-771-0
目的研究中山市孕中期妇女产前筛查指标的中位数,比较本地与内置中位数方程对产前筛查效率的影响。方法采用时间分辨荧光分析法检测2016年1至12月孕中期血清标本的游离β-人
摘 要:现代企业制度下,建筑施工企业的经济统计工作在科学管理、经济监督等方面的作用非常重大。但是,当前建筑施工企业的经济核算、经营决策等工作中,经济统计工作并没有发挥其应有的作用。笔者在分析建筑施工企业经济统计工作中存在的问题的基础上,提出了解决问题的对策。  关键词:加强;建筑施工企业;经济统计;对策    建筑施工企业的经济统计工作既是推行现代化科学管理的重要手段,也是监控经济运行状况的主要方
经症不是一个特定的疾病单元,而是包括病因、发病机理、临床表现、病理和预后不一致的一大类精神疾病[1].笔者10余年来,将神经症中神经衰弱、焦虑症、疑病症等从中医郁病辩证