论文部分内容阅读
k-means算法一个很大的缺点是不能消除异常值对聚类结果的影响,而层次聚类方法和基于密度的聚类方法都能够很好地找出异常值.本文提出一种两步聚类方法,先用基于密度的聚类方法找出异常值,再用k-means算法进行聚类,其中k值可以参考第一步聚类结果来确定.文章最后给出了实例分析,对比聚类效果.