基于跨库检索的科技文献个性化推荐系统研究与实现

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:wo6857953
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今随着互联网规模急剧增长,科技文献电子资源数目也成倍的膨胀着,用户查找信息犹如大海捞针,“信息过载”和“资源迷向”问题制约着人们高效使用科技文献的能力。全文检索工具在一定程度上解决了信息查找的问题,但是大多没有考虑到用户的个性化需求。检索工具每次检索都是根据检索词在全局范围内检索和结果排序,任何人使用同一个检索式进行检索时,得到的检索结果都是相同的。如何帮助广大的科技工作者以其有限的精力从海量数据中找到符合自己兴趣偏好的科技文献,并追踪最新文献资源的发表,成为了目前迫切需要解决的问题。   本文的主要工作就是在推荐领域的已有基础上设计了一个基于跨库检索的科技文献个性化推荐系统,来满足科技工作者对科技文献阅读的个性化需求。本文解决的关键技术主要包括:   1、跨库检索:互联网上存在着众多文献服务机构,各自提供独立的检索工具,本文分析各个机构的检索接口,设计了一个跨库检索工具,对外提供统一的检索接口,可以同时检索、采集多个文献机构上的科技文献资源,并抽取出统一格式的科技文献信息。   2、混合推荐系统:将混合推荐系统与跨库检索相结合,对跨库检索得到的结果采用基于内容推荐算法根据用户兴趣模型进行二次过滤得到匹配文献列表,并且使用协同过滤算法挖掘与目标用户兴趣相似的用户群都感兴趣的文献得到相关文献列表。这两个列表构成用户的推荐文献集。   3、概率主题模型:引入概率主题模型作为特征降维工具,将文本在词条空间中的表达转换到主题空间中来;提取用户感兴趣文献集的共现主题特征作为用户模型,得到用户兴趣模型主题空间向量的表达。   4、用户模型和文献管理:通过本系统,用户可以阅读、注释、标注、收藏、删除文献等,构建个人专有科技文献库。同时,系统隐式采集用户行为数据,分析用户对文献的评分,以动态更新用户模型。   经过实验表明,该系统取得了良好的效果,有效地满足了科技工作者追踪自己感兴趣的科技领域的文献的个性化需求。
其他文献
随着计算机水平的不断发展以及数据库规模的日益增大,人们拥有海量需要处理的数据。为了能够提升数据的查询质量与处理效率,数据的使用者需要预先知道数据的结构。键集合信息是
一般地,软件测试是为了发现错误而执行程序的过程,目的是以尽可能少的时间和人力发现并改正软件中隐藏的故障。单元测试作为软件测试最低级别的活动,通过故障定位技术能够及
眩光效果是自然场景中一种重要的物理现象,分为星芒与发散两种不同的效果,它可以增强场景的艺术性与真实感。眩光效果的计算机模拟绘制在游戏动画、虚拟仿真和影视制作等领域有
车辆路径问题(Vehicle Routing Problem,VRP)是物流配送过程中的关键问题之一。随着物流配送行业竞争日益激烈和客户对物流配送时效性要求越来越高,对VRP的研究,尤其是对带时间
多智能体系统(Multi-Agent System,简称MAS)是分布式人工智能的一个重要分支。多智能体具有自治性、分布性、主动性等特点,具备分布式和并行解决问题的能力,因此被广泛应用于协调
通过计算机模拟军事训练来提高部队的战斗能力已成为一种趋势,军事想定是为军事仿真系统提供初始状态、作战计划和发展趋势等信息的文件,是仿真运行的依据,提高其在不同仿真系统
随着移动互联网时代的来临,随时随地的进行信息的识别和传输成为信息化时代的新要求。二维图形码技术就在这种环境下应运而生,并在移动互联网领域中占据了主导地位,成为当今学术
在航线维修工作中,目前采用的各类故障诊断技术普遍存在诊断能力不足、效率低下、可信度差等问题,导致实际工作中仍然需要大量技术专家现场分析诊断。  本研究提出了一种基于
炭黑是许多烃类物质经过不完全燃烧或裂解生成的超细的烟炱,被广泛应用作橡胶,涂料和油墨等工业等的基本原料,也是橡胶制品的重要补强材料和填充材料。全球范围内对炭黑的需求量
数据加密是网络信息安全的重要组成部分,AES算法是由美国国家标准与技术研究院(NIST)选定的新一代数据加密标准。作为目前最优秀的对称加密算法,其应用已深入各个安全领域,针对A