论文部分内容阅读
聚类是数据挖掘中的一个重要研究课题,是数据挖掘的核心技术。聚类算法已被广泛深入的研究,其间产生了许多不同的聚类算法,这些算法适用于特定的问题及用户。为了更好的使用这些算法,人们已经提出了很多评价算法好坏的标准。从另外一个角度来评价聚类算法-利用分布间的覆盖率对算法进行比较。基于覆盖率和分布的几何特性可以生成高斯分布数据集,然后利用数据集来测试得到不同算法的适用性。