论文部分内容阅读
本文以个性化搜索和信息提取为基础,综合两个方向的经验和方法,提出以构造信息库为基础的个性提取和信息推荐方案。
个性化服务是当今网络服务的热点之一。根据对用户的个性进行提取分析,确定用户的爱好,以此来进行资源的推荐。在搜索引擎日益成熟的今天,个性化提取推荐的服务需求越来越大,已经成为搜索领域研究的重点之一。而Maze是一个网络文件共享系统,采用中央服务器控制心跳、建立索引,客户端承担资源上传的机制。由于客户端拥有独立计算分析用户个性的能力,在收集大量用户信息的同时,Maze服务器还能统筹客户信息,使得Maze系统成为适宜进行个性化提取和推荐的研究平台。
首先对用户行为所体现的心理作一番分析,确立了一套描述用户个性的方式,使得被提取出的个性有了载体。这一个性描述方法便于实现,能够正确地体现用户的兴趣所在。根据个性描述可以方便地刻画出用户的特点。接着详细分析Maze系统中的语言特点和用户行为之间的关联。分析了Maze语言以短语为主的语言环境,研究各种用户行为的个性体现方式。然后介绍信息库的结构和每一个部件功能,并详细说明构造信息库的半自动方法,由人工进行收集和判断,兼以计算机辅助分析过滤。着重介绍了信息库每一个组成部分的设计理念和构建策略。最后介绍了该信息库在网络信息提取和相关网络文本处理中的重要作用。最后将Maze中个性化提取推荐的实现进行说明。作为整套方法的系统实践,可以看出个性描述方式和信息库的构建是全部工作的基础,在此基础上,提出合理的抽取和推荐形式。