论文部分内容阅读
随着近年来互联网的飞速发展,如何在浩如烟海的文本信息中挖掘潜在的知识和规律是一个急需解决的问题。Internet上的信息主要是通过网页文本的形式表现出来,Web文本挖掘是为了达到从非结构化的网页文本中发现有用的知识和规律的目的。简要地介绍了Web数据挖掘的含义和种类、Web文本挖掘的含义和过程,并对Web文本挖掘过程各方面的相关技术做了进一步探讨,重点分析了文本特征表示、特征提取、分类、聚类等相关技术。