文档聚类相关论文
近年来,随着Internet 的不断普及,越来越多的用户利用搜索引擎来搜索网上的信息,尽管搜索引擎的发展已经比较成熟,但人们却发现要......
搜索引擎已成为网上使用率最高的工具之一。它的主要衡量指标有两个:覆盖率和精度。然而,调查显示,单独一个搜索引擎对网上信息的覆盖......
本文对文档分类和聚类方法及其在信息检索中的应用进行了深入研究,主要包括以下几个方面的内容:通过对当前分类方法的分析,提出了......
随着网络技术的迅猛发展,许多公司都企图借此以更贴近用户的服务提高各自的竞争力。用户到底偏好什么成了他们重点关注的问题。人......
伴随着万维网的发展,越来越多的人开始以网络进行生活、工作和学习.信息检索已经构成网络的一个不可或缺的因素.在进行信息检索时,......
聚类技术是数据挖掘领域具有重要价值的技术之一,随着网络在社会生活的不断深入,加之数据库技术的迅速发展和普及,Web挖掘日益受到......
近几年来,随着社会信息化进程的不断深入发展,人类对信息的需求和依赖程度越来越高,如何从海量的信息资源中快速有效的获取有用的信息......
XML(e Xtensible Markup Language)是因特网中信息描述、传输和交换的重要标准,而XML文档聚类是众多XML文档整合和管理技术中关注......
随着社会信息化进程的不断深入发展,人类对信息的需求和依赖程度越来越高,如何从海量的信息资源中快速有效地获取有用的信息,已经......
近年来,随着互联网的快速发展,网络上的数据越来越庞大,而且数据的类型也越来越繁多,如何有效地利用这些数据,从中提取用户所需要......
随着Internet的飞速发展,搜索引擎成为人们在网络中频繁使用的工具。然而,随着网络中信息的急剧增加,传统集中式搜索引擎已经越来......
话题检测是处理互联网新闻的一种重要方法,使用聚类方法对新闻文档进行处理是实现话题检测的一条重要途径。凝聚层次聚类算法由于......
随着互联网技术迅猛发展,XML文档由于其自身的自描述性、半结构化、可扩展性等特点,已经成为当今网络时代的信息载体与交换方式,一......
互联网的快速发展导致了互联网上的信息量与日俱增。如何从互联网上获取用户所需要的信息已经成为了一个热门问题。在这个背景下,信......
随着的Intemet飞速发展,人们利用Intemet发展和共享各种信息,使得信息爆炸式增长,普通网络用户查找所需资料变得非常困难,搜索引擎正是......
DNA-GA算法本质上是建立在DNA编码上的遗传算法,是将进化计算领域和DNA计算相结合的一种表现形式。DNA-GA算法所采用的DNA编码方式......
随着计算机网络以及数据库技术的快速发展,各领域积累的半结构化数据和信息急剧增加,迫切需要面向知识发现的方法,而数据挖掘的出......
利用一种基于十字链表快速挖掘频繁项集的算法代替传统算法产生频繁项集,改进基于频繁项集的文档聚类方法在web文档上的应用.通过......
K中心点算法是一个常用的聚类算法,它的主要缺陷是容易陷入局部极值,计算代价太高.本文先构造一个运用余弦相似度的K中心点文档聚......

