论文部分内容阅读
谱聚类算法是一种经典的聚类分析方法,与传统的聚类算法相比,它具有在任意形状的样本空间中聚类且收敛于全局最优解的优点,非常适合于许多实际问题,所以一直是机器学习领域中研究的热点。而图像作为一种重要的信息表达、传递的方式,在人类的社交中扮演着越来越重要的作用。图像分割是图像处理到图像分析的关键,是理解图像和识别图像的基础,因此,找到一种有效的图像分割方法对促进图像的应用非常关键。近年来有关谱聚类算法在图像分割中的应用研究受到了众多学者的广泛关注。虽然,目前基于谱聚类算法的图像分割技术己经取得了一些好的结果,但是,由于该技术仍处于初级研究阶段,因此仍然存在着许多亟待研究和解决的问题。本课题针对谱聚类算法利用先验信息提高聚类质量的问题,研究了如何使用先验信息调整相似度矩阵,使相似度矩阵具有更明显的数据结构,并对类簇结构监督调整,给出了一种改进的基于贝叶斯决策的半监督谱聚类算法,并通过Nystr?m逼近采样的方式将该算法应用于图像分割中。 本研究主要内容包括:⑴如何充分利用先验信息的问题。有效的利用先验信息对提高聚类质量能够起到事半功倍的效果,针对这个问题,给出了一种改进的基于贝叶斯决策的半监督谱聚类算法。该算法通过基于贝叶斯决策对相似度的内容进行调整,使相似度矩阵具有更明显的类簇结构,从而改善用于聚类的特征向量的分布,同时利用先验信息对得到的类簇结构进行监督,并对违反约束的样本重新划分类簇,以提高算法的准确性。实验证明,该算法较传统的聚类算法在准确性上有显著改善。⑵如何有效、快速的应用于图像分割中的问题。Nystr?m方法是一种逼近技术,能有效的解决大数据的计算问题。由于图像信息丰富,需要耗费大量的时间和空间来计算相似度矩阵,针对这个问题,给出了基于Nystrm逼近的半监督谱聚类算法。该方法通过对图像样本的采样,给出相似度矩阵的估计,从而得到特征空间的估计,完成对图像的分割。实验证明,该方法能够快速、有效的实现图像的分割。