论文部分内容阅读
伴随着信息技术的迅速发展,网络信息量以指数级增长,以及网络信息检索工具效率低下,使用户很难从网上检索到所需信息。在本人参与的科技信息资源中心系统中,由于科技信息资源数据量大,无序堆积等因素,传统的关键词检索和分类浏览目录已经无法满足用户需求,获得科技信息资源困难成为了影响用户体验的一个关键因素,因此迫切需要一种有效的资源组织和获取方式,使用户快速定位到感兴趣的资源。分面分类是一条改进关键词搜索和体系分类法的出路。分面分类体系容量大,能与世界上主题检索的发展趋势融合起来,分面分类体系的特性更加适合于计算机处理,是适应现代信息标引和检索需要而发展起来的分类法。然而分面分类的编制过程是一个非常繁琐复杂的过程,现有的Ranganathan的PMEST模型和Louise的分面分析模型都是针对特定领域以及由人工参与完成的。针对上述问题,本文结合科技信息资源中心项目,以科技信息资源的组织和获取为背景,进行了以下的研究工作:
(1)针对人工编制分面分类效率低下的问题,通过分析结构化数据集的特点,本文提出一种自动构建单个数据集分面分类的方法,通过对数据集属性的统计分析,计算出数据集的分面分类,提高了分面分类的效率。
(2)为了满足用户对不同数据集统一分面分类视图的需求,本文给出了一种分面分类融合方法,该方法通过计算分面的概念语义相似度进行分面的融合,为分面分类融合提供一种思路。
(3)在科技信息资源中心系统的基础上实现了分面分类原型系统,并以具体场景实例,对系统进行了验证。从系统的运行效果可以看出,分面分类应用系统使得在检索资源时,浏览检索界面直观,思路开阔,用户使用方便简单。