元搜索引擎提问融合方法研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:gaolch005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文将信息融合理论与元搜索引擎的研究相结合,在相关理论的基础上,对提问融合方法做一些探讨和研究。本文介绍了信息融合基本含义、原理、层次结构以及技术、方法,总结了查询扩展的三类方法,并着重介绍和分析了相关反馈的定义、类型、技术与算法,详述了语言模型的建模过程与方法。   本文的研究内容包括以下几个方面:   首先,提出了对用户的查询行为进行信息挖掘,给出了记录用户信息需求的三种方式,并分析用户的查询行为,对用户的信息需求进行分类。本文试图利用用户查询日志来探寻用户的信息搜索行为,提出了基于用户查询日志的两种提问融合策略:基于用户查询模糊聚类的提问融合策略和基于用户点击文档用词的提问融合策略,从而利用日志进行伪相关反馈。   第二,基于用户查询模糊聚类的提问融合策略足利用系统聚类法对用户查询日志中的用户查询进行聚类分析,用户查询是聚类的样本,每条用户查询所对应的用户点击的文献是聚类样本的特征。   第三,基于用户点击文档用词的提问融合策略将用户查询中使用的词或短语与文档中出现的相应词或短语以条件概率的形式连接,利用贝叶斯公式挑选出文档中与该查询关联最紧密的词加入原查询,以达到扩展优化的目的。   最后,本文总结了TopK反馈程序和自动选取前K篇文献的两种策略,提出了使用语言模型为工具计算相关度系数,据此改进了多查询与伪相关反馈的融合,提出了基于TopK反馈的提问融合算法。   本文的创新之处是提出了基于用户点击文档用词的提问融合策略和基于TopK反馈的提问融合算法。
其他文献
2015年初七开拓陌生的忻州理疗市场,创业同样需要付出与努力,真金不怕火炼,好技术不怕验证,短短时间范老师在忻州管理的多家理疗店面顾客爆满,每周课堂学习理论与两次跟店实
当每天都有数以亿计的用户通过计算机、网络交互进行工作和生活,个人信息管理的重要性日志凸显。妥善的个人信息管理会大大提高人们工作和生活的效率,糟糕的个人信息管理则会使
学位
[目的 /意义]云环境下,很多行业和领域选择将服务器托管到云中,图书馆也不例外。目前,国外的很多图书馆已经开始应用Iaa S,并取得了一定的效果。通过分析国外图书馆应用Iaa S
摘 要:近年来,随着城乡建设速度加快,人口越来越集中,饮水难的问题也逐渐凸显,尤其是在一些岩溶地区,找水南成为制约当地经济发展的重要因素。基于此,本文以岩溶石山找水工作为研究对象,首先分析了岩溶石山找水工作的难点,然后分析了现阶段综合物探电法在岩溶石山找水中的研究现状,最后通过实例分析综合物探电法应用的可行性,希望对我国岩溶石山找水问题的解决有所帮助。  关键词:岩溶石山;找水;综合物探电法;研究
改革开放以来,高校“弱势学生群体”的出现,给学校的正常教育教学工作带来了影响,同时也给教育工作者提出了一个新的课题。随着改革的不断深入,高校”弱势学生群体”的数量正在逐
本文在明确反竞争情报研究框架的基础上,引入基于控制论思想的反竞争情报的策略,并将解决实际问题的相关方法引入企业反不正当竞争工作中,使得企业反竞争情报的研究内容更加丰富
[目的/意义]立足于当前地方历史文献的现实基础,对文献的整理、分类和研究等工作展开探索性实践,从而设计出促进地方历史文献数字化发展的具体路径.[方法/过程]分析当前地方
曾三是新中国档案事业的领导者和开拓者,他的档案学思想理论为我国档案事业的建设与发展起着重要的指引作用,也正是在档案工作的实践中曾三不断研究与总结出档案及档案工作的
[目的 /意义]对科学共同体中权威学者的地位与作用开展研究,以合著网络结构分析为视角,将网络分析与高h指数学者的作用研究相结合,从作者节点所处的网络结构与位置中探寻学者
知识经济时代,网络技术的应用和知识管理的兴起对图书馆工作提出了新的挑战,知识服务成为世纪图书馆界的研究热点。但是,无论在理论层面而还是实践层面,目前高校图书馆知识导航尚