论文部分内容阅读
马尔科夫聚类算法(Markov Cluster Algorithm,MCL)是一种快速且可扩展的无监督图聚类算法,Chameleon是一种新的层次聚类算法。但MCL由于过拟合会产生很多小聚类.Chameleon由于时间复杂度为0(N2)不利于处理大规模数据集。针对这两个问题,提出了一种基于MCL与Chaineleon相结合的混合聚类算法。该算法第一阶段采用MCL算法对原始数据进行初步聚类.第二阶段利用GPU加速的Chameleon算法将第一阶段产生的小聚类进行归并,从而得到质量更高的聚类。实验表明,与传统