论文部分内容阅读
高维数据聚类一直是聚类研究的难点之一,在数据不完备的情况下尤其具有挑战性。针对高维不完备数据提出基于容差集合差异度的聚类算法(CABOTOSD),通过定义的容差集合差异度、容差集合精简和容差交运算,可以直接计算不完备数据对象集合内所有对象的总体差异程度,不必进行缺失数据的填补,并且在不影响计算精确度的情况下对数据进行高度压缩,只需一次数据扫描就能得到聚类结果。将该算法与著名的K-modes及其各种改进算法进行比较,实验结果表明CABOTOSD是有效可行的。