基于叙词表用代关系的概念语义研究

来源 :中国科学技术信息研究所 | 被引量 : 0次 | 上传用户:gaoxuan1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
同义关系是知识组织系统的重要成员,同义关系的识别是不同的知识组织系统融合的主要内容。论文界定同义关系、用代关系、用代类型、用代传导、概念优选词、概念特性、缩略语等概念,对比分析国际标准、中国标准、美国标准、英国标准等标准中用代关系的定义,总结国内外叙词表中用代关系研究现状、同义关系研究现状、概念相似度研究现状、概念语义应用研究现状以及词表融合研究现状,分析同义术语识别的影响因素,即缩略语、多义词、叙词表颗粒度等。  论文分析了叙词表中缩略语的收录原则,并归纳出3种缩略语的处理方法,即添加全称限制、添加范畴限制、基于词频大小等和4种多义词的处理方法,即添加学科名称限制、添加中图分类限制、添加中文翻译限制、基于义项词频大小等。  结合用代关系的特点,论文概括出了5种同义术语识别方法,即基于用代关系类型、基于术语释义分析、基于术语的原形化、基于概念外延和内涵、基于术语的分类号等。在此基础上,论文还总结了4种概念优选词的选择方法,即基于来源叙词表、基于文献词频大小、参考中文叙词表优选词、参考专业人员和用户的推荐等和4种概念优选词的翻译方法,即基于来源叙词表词间关系、基于《汉语主题词表》、基于英汉词典及词频大小等。  缩略语与全称的等同关系是一种特殊的用代关系,为了更深入的分析研究,论文选择交通领域52335个包含缩略语的样本,进行缩略语自动识别实证研究。通过字母匹配的方法进行识别,并把缩略语的处理方法应用到实证中。同时,论文还选择交通领域5055个术语作为同义识别的样本,采用基于叙词表颗粒度、基于术语原形化、基于缩略语与全称等3种识别方法进行实证。依据自动识别组数、准确识别组数、人工纠正组数、准确率、分布率等分析识别方法的效果。
其他文献
2011年10月10日是辛亥革命100周年纪念日。任凭一个世纪风风雨雨的冲刷与磨砺,我们永远不能将这段历史忘却。“世间无物抵春愁,合向苍冥一哭休。四万万人齐下泪,天涯何处是神
对近现代图书馆时代、自动化图书馆时代和数字图书馆时代的运作体系进行阐述,预测图书馆运作体系的发展趋势,认为其将来存在两种不同的可能:即在出版市场上,纸质文献被数字文
用来提高人们生活质量的磁疗法理论早在16世纪就已经形成,从那时起,人们就提出了磁疗法在治疗疾病,如骨折、创伤、慢性疼痛、甚至精神紊乱等方面有很大的帮助作用。但目前关
在信息化的时代背景下,互联网极大地延伸了人们的生活空间,人们可以通过网络方便地获取信息,广泛地进行交流,自由地发表观点,深入地评论社会问题,由此而形成的网络舆情在一定程度上
现今高校图书馆电子资源馆藏规模的不断增大,极大地方便了高校的教学科研工作,但是,广大用户在使用电子资源时也面临着诸如不知图书馆有哪些资源、不知自己所需的资源在哪一个数
在过去的30年中,传统的三大能量供应系统被认为是影响竞技游泳运动成绩的主要因素。这三大能量供应系统中的每一种都为肌肉收缩,推动人体移动提供能量。这三大能量系统分别是
信息技术的迅猛发展,带来了古籍整理方式的重大变革。古籍书目数据库逐渐取代传统古籍目录。经过近三十年的发展,其揭示全面、快捷检索,利于共享的优势极大的方便了各个古籍收藏
突飞猛进的信息化使得各个应用领域所积累的资源在飞速增长。快速发展的网络资源为人们提供了丰富的信息,同时也使人们淹没在信息的汪洋中。如何有效地开发和利用这些丰富的信
通过对辛亥革命前后全国创办杂志的统计及宣传活动的调查与归纳,以表格形式展现当时杂志生态的基本信息。介绍当时杂志在刊名、封面、办刊宗旨、编者资源以及生存竞争等方面的
澳大利亚从1988年开始实施运动员选材计划,先以赛艇项目为试点。随着赛艇项目在选材上取得成功,自行车、皮划艇和田径等众多其它项目也纷纷采取了更系统、更科学的运动员选材