一种分面分类方法的研究及其在信息资源动态组织中的应用

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:htech888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着信息技术的迅速发展,网络信息量以指数级增长,以及网络信息检索工具效率低下,使用户很难从网上检索到所需信息。在本人参与的科技信息资源中心系统中,由于科技信息资源数据量大,无序堆积等因素,传统的关键词检索和分类浏览目录已经无法满足用户需求,获得科技信息资源困难成为了影响用户体验的一个关键因素,因此迫切需要一种有效的资源组织和获取方式,使用户快速定位到感兴趣的资源。分面分类是一条改进关键词搜索和体系分类法的出路。分面分类体系容量大,能与世界上主题检索的发展趋势融合起来,分面分类体系的特性更加适合于计算机处理,是适应现代信息标引和检索需要而发展起来的分类法。然而分面分类的编制过程是一个非常繁琐复杂的过程,现有的Ranganathan的PMEST模型和Louise的分面分析模型都是针对特定领域以及由人工参与完成的。针对上述问题,本文结合科技信息资源中心项目,以科技信息资源的组织和获取为背景,进行了以下的研究工作:   (1)针对人工编制分面分类效率低下的问题,通过分析结构化数据集的特点,本文提出一种自动构建单个数据集分面分类的方法,通过对数据集属性的统计分析,计算出数据集的分面分类,提高了分面分类的效率。   (2)为了满足用户对不同数据集统一分面分类视图的需求,本文给出了一种分面分类融合方法,该方法通过计算分面的概念语义相似度进行分面的融合,为分面分类融合提供一种思路。   (3)在科技信息资源中心系统的基础上实现了分面分类原型系统,并以具体场景实例,对系统进行了验证。从系统的运行效果可以看出,分面分类应用系统使得在检索资源时,浏览检索界面直观,思路开阔,用户使用方便简单。  
其他文献
近年来,随着Internet的飞速发展和生活中信息化水平不断提高,数据资源呈爆炸式增长,导致获取目的信息困难,信息的利用率降低,而高维数据日益成为主流,所以在实际的聚类应用中
线程池技术是提升多线程应用程序性能的重要技术,已经广泛地应用在各种网络服务器应用程序、中间件等领域。线程池的研究重心已经从静态线程池转移到动态线程池,然而,如何动态提
项目是指特殊的、将要被完成的有限个任务的集合。它是指在一定时间之内,满足所有目标的多项相关工作的总和。项目管理是指以项目为对象的系统组织管理方式。它通过搭建临时
在软件开发的过程中,需求项如果没有经过深入协商,并且没有在各涉众之间达成一致,会对后期的开发带来不必要的重复工作,导致开发成本上升,甚至项目失败。WinWin协商模型是一
互联网业务呈现出以用户为中心的融合趋势,多数机构已在管理域内实现单点登录和Web业务融合,而跨管理域的业务融合应用较少。流化业务在此背景下被提出,它是在互联网分布式计算
网络的不断发展使得信息安全成为网络应用不可缺少的技术基础,网络信息系统需要保护其真实性、保密性、完整性以及可追究性。公钥密码技术是信息安全的核心技术,它给电子商务的
随着Internet的不断发展,Web数据逐渐成为人们关注的焦点。Web上拥有着大量有价值的数据,其中Web源上的结构化数据就是其中之一。Web源上的结构化数据是指将Web源上的网页数
随着信息技术和互联网技术的高速发展,视频逐渐成为了人们获取和传递信息的一种重要媒介。视频中的文字是一种高级语义信息,能够为视频索引与检索提供十分重要的辅助信息。如
视觉真实感绘制是通过对人眼进行光学建模,以人眼模型为成像模型,对人眼的多种成像特性和视觉缺陷进行模拟成像的技术。它能够绘制反映人眼球面像差、近视和远视等视觉特性的图
带有通配符的字符串匹配问题已成为诸多领域的研究热点,例如生物信息学、数据库系统中的SQL查询、搜索引擎的文本索引、文件名查找、网络入侵检测等领域。然而,带有通配符的