面向用户的查询扩展研究与实现

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:luoqiuqiu80
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着Internet的飞速发展,Web资源以指数级的速度增长,到2004年初,网页数量大约达到80亿。目前搜索Web资源的形式多种多样,使用最广泛的是搜索引擎,但当前的搜索引擎检索信息主要考虑的是通用性,没有体现个别用户的信息需求,个性化信息服务能有效地满足个别用户的信息检索需求。此外,有研究表明人们在访问Web时58-81%的网页访问是访问已访问过的网页。因此在实现个性化信息服务的同时,对用户已访问的网页进行有效管理也是有现实应用意义的。 由于目前大多数检索系统中,用户的需求是通过查询关键词来表示的。用户实际需求与查询关键词之间是存在较大语义差距的。如何缩小这种语义差距是实现面向用户个性化信息服务的关键问题。本文应用查询扩展方法,给出了对查询关键词的增加、删除和权重修改的自适应模型,使之能够更好的满足用户的实际需求,提高了检索的精度。在模型中给出了确定扩展关键词的数量及优化了查询反馈中权重调节因子α,β,γ,λ。 我们合作设计了一个基于个人的电子信息助手原型系统,其主要思想是:首先,在每一个用户注册时,我们要求用户给出他的基本信息、兴趣类、查询关键词等信息。对每一个新注册的用户,我们将根据该用户的兴趣类为该用户建立初始的用户兴趣模型。然后,我们将借用现有的搜索引擎(如Google,Baidu等)进行信息查找,对返回的结果文档,利用用户兴趣模型过滤掉与用户兴趣不相关的文档,再将剩余的文档重新排序显示给用户。用户可对感兴趣的文档下载、浏览,系统将根据用户的行为反馈自动地更新用户的兴趣模型并扩展查询,以使系统中的用户兴趣模型能真正地代表用户当前的兴趣。同时实现了网络信息管理功能,能将搜索到的信息自动归档。 进一步研究工作:1.尝试使用其它方法进一步改善查询扩展自适应模型。2.权重调节因子α,β,γ,λ有待进一步优化。3.完善系统的功能。
其他文献
数据库中的知识发现(KDD)是当前涉及统计学、人工智能、数据库等学科的热门研究领域。数据挖掘(DM)是从数据中提取人们感兴趣的、潜在的、可用的知识,并表示成用户可理解的形
  本文首先分析STP的相关技术,这类技术能较好的解决网络环路的问题。重点分析了STP/RSTP/PVST/MSTP技术在解决环路保护的优缺点,指出了该类技术虽然发展到较为成熟的MSTP,但
软件构件化可以说是跨世纪软件技术发展的必然趋势,也是软件工程界的一个热门话题。随着传统构件技术与Internet的进一步融合,基于Internet异构环境下分布式软件构件——网络构
计算机图形学的特点之一是广泛地使用三维几何数据来描述场景。三角形网格是一个标有一些属性信息的三角形的集合。这些属性包括两部分内容:第一部分叫做拓扑信息,用于描述多
在知识经济的时代,人们普遍利用网络来传播和获取各种知识。传统获取知识的方式是人们通过搜索引擎来查找互联网上的信息,查找到的信息通常是存放在Web服务器上。这种获取知
软件复用是运用现存系统的软件制品或工程知识构造新系统,避免重复劳动的解决方案,它被视为解决软件危机,提高软件生产效率和质量的现实可行的途径。软件复用的核心技术是软件构
本论文首先描绘了监控领域的发展蓝图,然后介绍了项目课题的立项与背景,项目的研究价值与目标;接着从系统的设计、实现和优化三个阶段深入剖析了项目的设计开发过程;最后在对项目
在当前的信息安全领域中,基于公钥基础设施(PKI)建立起来的身份认证技术已经非常成熟。但是对于安全要求越来越高,系统复杂程度越来越大的现代信息安全体系,单独的身份认证技
智能用电系统的基本功能是融合电能实时计量、自动控制、网络通信等技术,实现电能消费的可见、可控、计划性和自动规划等目标。智能用电系统由多个智能用电插座和一个智能用
XML已经成为现今因特网中储存和交换信息的标准语言。XML允许你使用任何虚拟型态的信息,从简单的单个数据到复杂的数据如多媒体数据,都可以由XML存储。随着XML作为一种存储数