论文部分内容阅读
随着信息技术与数据存储技术的不断发展,数据挖掘作为一种强有力的信息处理技术,已经成为当前最前沿和最活跃的研究方向之一。而聚类分析正是其中重要的一门学科,现在被广泛使用的聚类分析算法大多数都已知了数据集的类别数,然后才对数据集进行划分,然而在现实生活中,我们获得的许多数据集是没有任何先验知识的,类别数未知或不能用近似的方法得到。在这种情况下,提出一种高效的自动聚类算法以有效、精确的获取数据信息已成为当前数据挖掘方面研究的热点之一。基于以上的背景,本文提出了两种自动聚类算法,一种是基于质心振荡策略的单目标自动差分聚类算法,另一种是基于点对称距离的免疫多目标自动聚类算法,并将其应用到了图像分割领域,主要研究内容如下:1.提出了基于质心数振荡策略的自动差分聚类算法。算法中使用了一种基于实数编码的定长染色体编码方式,针对该染色体编码方式,我们提出了一种基于类别中心密度排序的质心数振荡策略,提高算法的局部搜索能力。此外,我们还在该自动聚类算法中引入了改进的差分进化思想、模糊策略以及参数自适应化来进一步提高算法的聚类性能。仿真实验对8个UCI数据集,6个球状特征数据集以及6个中心对称的数据集进行了对比测试,实验结果表明,新算法在3个有效性指标上都优于其他对比算法。2.提出了基于点对称距离及振荡策略的免疫多目标自动差分聚类算法。在该算法中针对单目标自动聚类算法的不足,引入了多目标优化思想,提出了一个新的基于点对称距离的聚类有效性指标函数,和XB指标相结合,用多目标优化的方法对其进行优化,并使用免疫克隆的思想来保持种群的多样性,实现了数据的自动聚类。并且同时在第二章基础之上提出了新的变异算子来提高算法的局部搜索能力和算法聚类精度。最后通过设置实验对18个数据集进行了测试,实验结果表明新算法在数据聚类性能上要优于其他对比算法。3.提出了基于自动聚类算法的纹理图像和SAR图像分割方法。针对纹理图像和SAR图像分割问题,我们结合前两章所提出的单目标的和多目标自动聚类算法,分别提出了基于这两种算法的图像分割方法,并与一些比较流行的图像分割算法进行了测试比较.实验结果表明,在图像分割类别数未知的情况下,本文所提出的自动聚类算法可以达到更好的分割结果和分割精度,可以获得更加准确的区域一致性和更好的边缘保持性能。本文得到如下基金资助:国家自然科学基金:61272279和61001202;中国博士后科学基金特别资助:200801426;中国博士后科学基金:20080431228以及中央高校基本科研业务费专项资金资助:JY10000902040。