基于信息库的个性提取与信息推荐

来源 :北京大学 | 被引量 : 0次 | 上传用户:lbx5000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以个性化搜索和信息提取为基础,综合两个方向的经验和方法,提出以构造信息库为基础的个性提取和信息推荐方案。 个性化服务是当今网络服务的热点之一。根据对用户的个性进行提取分析,确定用户的爱好,以此来进行资源的推荐。在搜索引擎日益成熟的今天,个性化提取推荐的服务需求越来越大,已经成为搜索领域研究的重点之一。而Maze是一个网络文件共享系统,采用中央服务器控制心跳、建立索引,客户端承担资源上传的机制。由于客户端拥有独立计算分析用户个性的能力,在收集大量用户信息的同时,Maze服务器还能统筹客户信息,使得Maze系统成为适宜进行个性化提取和推荐的研究平台。 首先对用户行为所体现的心理作一番分析,确立了一套描述用户个性的方式,使得被提取出的个性有了载体。这一个性描述方法便于实现,能够正确地体现用户的兴趣所在。根据个性描述可以方便地刻画出用户的特点。接着详细分析Maze系统中的语言特点和用户行为之间的关联。分析了Maze语言以短语为主的语言环境,研究各种用户行为的个性体现方式。然后介绍信息库的结构和每一个部件功能,并详细说明构造信息库的半自动方法,由人工进行收集和判断,兼以计算机辅助分析过滤。着重介绍了信息库每一个组成部分的设计理念和构建策略。最后介绍了该信息库在网络信息提取和相关网络文本处理中的重要作用。最后将Maze中个性化提取推荐的实现进行说明。作为整套方法的系统实践,可以看出个性描述方式和信息库的构建是全部工作的基础,在此基础上,提出合理的抽取和推荐形式。
其他文献
随着时代步伐的加快,我们的社会步入了全球化的知识经济时代,此时人们对信息的依赖越来越强。信息的管理和利用成为这个时代的一大研究课题,而专利信息又是所有信息中的精华部分
伴随着互联网的大规模发展和计算机处理能力的提高,越来越多的现今网络应用所需要占用的网络资源也随之增加,这些复杂应用的存在,导致网络的数据传送能力相对不足。 本文在进
指令级并行自理是目前国际上比较热门的一个研究方向.而VLIW体系结构则是一种高并行度的指令级并行处理的体系结构.该文讨论了VLIW体系机构下的优化编译器的设计和实现中的一
随着数字学术资源数量的迅速增长,学生和研究者们越来越难以在浩如烟海的学术资源库中找到自己期望的资源。推荐系统是个性化搜索引擎外另一种有效的资源过滤手段。推荐系统根
特征值求解问题在众多的科学和工程领域都有着广泛的应用,因此特征值求解的研究一直是众多专家学者研究的热点。对于实际问题所产生的大规模稀疏矩阵,一般需要投影类算法进行求
IT技术的发展日新月异,软件及其应用架构、电子商务智能化(如搜索代理、卖方的主动推荐和双边及多边协商等)也在不断发展,从而能更好更快地为企业应用服务。本课题分析了一些比
该文的主要贡献在于系统分析了继承异常现象产生的原因,并结合Ada95语言和TH-PAda并行编译系统,提出了一种基于方法集法的解决方案--Ada-I语言和TH-PAda系统改进版本.Ada-I将
科学计算产生了大量的数据,大量的数据理解起来缺乏直观性。科学可视化就是用图形图像表示数据,帮助数据理解的方法。随着高性能计算技术的发展,高性能计算机产生了大量的数据,大
本文重点研究神州数码内部业务集成系统的设计与实现,该篇论文对于系统集成公司的业务信息系统建设具有参考价值和指导意义。 本文的研究对象是神州数码集成业务系统,该系统
一次乘出租车,和出租司机聊起某一广播节目,出租司机说,他非常欣赏一档节目中的"医生",因为他回答听众的问题不但通俗易懂,而且非常亲切和耐心。听下来,我明白了那是一档推销保