基于时间敏感的个性化查询词补全算法研究

来源 :北京林业大学 | 被引量 : 0次 | 上传用户:sb37sb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今互联网信息纷繁复杂,搜索引擎为互联网用户提供了良好的信息搜索体验。而搜索引擎的查询词补全技术又进一步提高了搜索引擎质量,为用户提供了更优质的搜索服务。目前查询词补全技术广泛应用于各搜索引擎,但大多依赖群体智慧策略。针对用户检索需求随时间变化而不同这一问题,时间敏感查询词自动补全技术越来越成为研究热点。时间敏感查询词补全在生成查询词补全候选列表时拟合多种时间因素,呈现出与传统查询词补全不同的特点。本文针对查询词自动补全技术非个性化及时间敏感化的问题,提出了一个方法“个性化时间敏感查询词补全”来推荐时间敏感的个性化查询。首先,将用户所有桌面操作行为数据组织建立索引,并存储于用户个人计算机中;其次,用贝叶斯公式描述用户需求和时间的关联,并应用时间序列预测模型计算时间敏感值;最后,根据时间敏感权值对所有补全候选词进行排序。通过最终的在真实数据集上的实验结果对比证明,论文模型可以用于加强信息检索,特别是查询词补全推荐相关领域算法。
其他文献
在传统的客户机/服务器(Client/Server,C/S)体系架构的企业应用系统开发中,数据一般存放在服务器上,应用程序一般存放在客户端计算机上。这样的系统虽然解决了数据共享等问题,但
数据压缩技术是多媒体领域的重要研究方向之一。由于多媒体数据量非常巨大,海量多媒体数据的存储和传输成为多媒体应用所面临的主要问题。通过使用数据压缩技术,对多媒体数据进
网络流量监测对于网络流量计费、资源规划、流量控制和流量工程等至关重要。随着Internet的快速发展,带宽不断增加,高速链路对实时网络流量监测提出挑战。由于监测设备软硬件性
随着人体运动捕获设备的发展和普及,以及深度摄像机在室内交互应用中的快速发展,人体运动识别与标注及相关技术在动画制作、电影特效以及交互娱乐等多项领域中发挥了越来越重要
随着半导体技术的发展,片上多核处理器以其高能效、高性能、低设计复杂度等诸多方面的优势已经成为微处理器发展的未来方向。缓存一致性协议是多核处理器中的一项核心技术。它
随着智能仪表、网络技术和数字通信技术的发展,现场总线和工业以太网技术在工业现场得到了广泛的应用。同时面对国内工业生产的安全现状,基于总线技术的控制系统越来越多地被用
随着互联网,特别是WEB2.0的快速发展,网络数据爆炸式增长。每天都有大量UGC(User Generated Content)网络内容产生和发布,怎样从浩大的网络数据中提取出有价值的信息,为进一步分
传统的激光引信设计和测试需要进行大量的实弹演练,为了克服由此造成的高耗费、低效率问题,本文设计并实现了一个基于虚拟现实技术的激光引信数字化仿真平台,用于辅助激光引信的
城市公交系统是与城市居民日常生活联系最为紧密的环节之一,甚至在一定程度上决定着城市居民的生活方式。城市公交查询能够帮助出行者快速地选择出行路径、换乘路线等,既提升了
查询优化是数据库管理系统设计和实现所采用的一项重要技术,也是直接影响数据库系统性能的一个重要因素,当前所有商用数据库都成功采用了这项技术。关系数据库系统和非过程化的