论文部分内容阅读
针对基于密度算法在高维数据处理中时间复杂度过大的问题,提出了一种基于n树空间索引结构的聚类算法,通过对划分后单元的合理编码,可实现快速判断任意单元的相邻单元。由于新算法采用了在n树生成过程中剪枝的方法,可有效地节省内存及IO的开销,与DBSCAN算法在不同维教上实验比较表明,新算法在处理海量、高维数据集的能力上有很大的提高。