论文部分内容阅读
概念网络的构建对语言学、心理学及计算机科学等领域产生了深远的影响。目前,概念网络主要基于语义构建或基于统计指标构建。其中,基于统计指标构建的概念网络能突破语种的限制,客观地建立概念之间的联系。传统基于统计指标建立概念关系的方法很多,但是往往人们仅关心不同概念之间是否相关及其相关程度,而不关心它们以何种方式相关。因此,可以将不同的概念关联方法结合起来,寻找综合的相关度描述概念之间的关系,从而构建概念网络。
本文分别基于文献计量中引证分析、共引分析和共词分析的方法,探索概念之间的相关度,并将三种指标综合起来,寻求新的相关度计算方法,构建综合的概念网络。本文的研究主要涉及三个方面:
首先,本文将以文献为基本单位的引证分析和共引分析,扩展到以概念语词为基本单位。由于同一篇文献中涉及多个概念,因此一次引证过程中,传统一篇文献对多篇文献的引用,转化为多个概念对多个概念的引用。由于概念数量大以及重复性高,因此需要考虑多种情况讨论基于概念的引证分析和共引分析。在此基础上,本文分别基于引证分析和共引分析,计算概念之间的相关度,建立概念关系矩阵。同时基于共词分析,分别建立基于这三种计量指标的概念网络。
其次,本文将三种计量指标综合起来,获很概念之间新的综合度计算方法,从整体上构建综合的概念网络。为了更为客观地综合三种计量指标,本文借鉴信息检索领域查准率的计算方法,探求概念之间的实际相关度,并以此为标准,设定权重系数将基于三种计量指标的概念相关度计算方法线性整合。
最后,为了清晰地显示概念网络,笔者开发出一套概念网络查询系统。用户输入一个查询概念,系统展示出与查询概念相关的概念网络局部图。该系统可以分别显示基于引证、共引及共词分析的概念网络,也可以显示综合这三种计量指标得到的概念网络,便于用户直观上对概念关系的认识。