【摘 要】
:
本文首先介绍了信息过滤的发展历史、研究现状和它的意义.随后对目前信息过滤的主要模型和方法进行了总结.简要介绍了我们的信息过滤系统及其主要的算法.文本特征提取和选择
论文部分内容阅读
本文首先介绍了信息过滤的发展历史、研究现状和它的意义.随后对目前信息过滤的主要模型和方法进行了总结.简要介绍了我们的信息过滤系统及其主要的算法.文本特征提取和选择是文本表示的关键技术.本文研究了文本特征提取中文本特征的描述、文本特征提取的粒度分析,以及传统的文本特征选择的方法并对其进行了简单的比较.用户兴趣是在信息过滤过程中实际使用的信息过滤标准,是文本过滤的核心问题.本文介绍了基于知识库和伪相关反馈的用户需求扩展方法和传统的初始用户兴趣构造方法.提出了一种引入标题权重的用户兴趣构造方法.简要地介绍了用户需求迁移和用户兴趣漂移等问题.文本分类是在给定的分类模型下,根据文本的内容自动确定文本类别的过程.传统的文本分类模型是基于词索引,是某种形式上的浅层次概念匹配,而非深层次的语义匹配.本文提出了一种基于LSI和Rough集的文本分类新方法.本文最后阐述了一个中文信息过滤系统的设计与实现.对中文信息过滤系统的系统结构、文本预处理、特征提取、用户兴趣的建立和阈值初始化、比较过滤以及自适应学习等进行了详细介绍.
其他文献
近年来,P2P流媒体系统已经成为了学术界和工业界研究的热点。与传统的C/S模型相比较,P2P流媒体系统架构可以充分利用终端的资源和能力去提升自身的可扩展性。当前,一些针对P2
随着计算机和网络技术的发展,企业数据库系统已向集成应用和和分布式处理模式发展,有效地管理企业计算中的大量授权数据已成为首要问题。 现有的访问控制技术主要有基于访问
二十世纪80年代,国外已经开始利用计算机技术对板材的结构进行模拟仿真,但鉴于当时计算技术发展的局限性,无法实现板材研究的计算机三维可视化。随着人造板技术与计算机仿真
软件过程技术在现代软件开发中越来越居于重要地位。人们普遍认为软件开发组织的高质量和高生产率依赖于三个因素:过程、技术和人。软件过程、从事软件开发的人员和所采用的技
我国是一个水资源严重短缺的国家,加之由于水资源的时空分布极不均衡,干旱缺水问题相当严重,未来的水资源形势更加严峻。我国节水农业的发展仍然是刚刚起步,提高旱作节水项目管理
计算机安全越来越受到人们重视。 在电子商务、电子政务、电子教务等等在线业务日益发展的今天,越来越多的人们依赖于网络从事自己的事务。网上事务面临的最大问题在于如何
1998年,世界上第一个搜索引擎系统GOOGLE在其诞生之初,就以超强的实用性赢得了广大网民的使用热情,其准确、快速的网络导航性,往往能使人们在第一时间找到自己所要的信息。但
遗传算法是一种新兴的技术,是借鉴生物界自然选择和进化机制发展起来的全局的概率搜索算法。本文对遗传算法进行了研究与改进,并结合旅行销售商(TSP)这个著名的NP完全难题,对求
Web服务的出现是internet技术发展的一次革命,使得Web上的交互方式从以信息为中心转化为以服务为中心,从而使internet上的各种应用集成成为可能。企业应用集成和电子商务等系
本课题主要对大规模地形数据(基于规则网格数字高程模型)的可视化算法进行研究并实现对SOAR算法的应用。对每个分块的地形数据采用SOAR算法实现地形的简化模型,并通过四叉树