自适应聚类和基于BYY和谐学习的自动直线检测

来源 :北京大学 | 被引量 : 0次 | 上传用户:cwwei1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一种有效的数据分析方法,聚类分析一直是机器学习和模式识别研究的一个重要内容。其应用已涉及到信息处理的各个领域。目前,聚类分析正与统计学习相结合,试图学习和探测数据的内部结构,对样本点进行有效的分类,从而形成了能够自适应确定数据中聚类个数并进行聚类的自适应聚类算法。本文中,我们提出了三种不同的频率敏感差异测度,并基此建立了相应的自适应聚类算法,即所谓的kmeans算法。该类算法有着类似于RPCL(对手惩罚竞争学习)算法的竞争学习机制,能够自动探测出样本数据中聚类个数,并进行合理的分类。我们可假设初始的种子点(即聚类中心)的个数k大于真实的聚类个数k,即k(?)k。该类算法通过竞争学习,最后保留k个真实聚类,而多余的k-k个聚类自动变为空集。实验结果表明,在模拟数据集和真实数据集上,我们所提出的三种k-means算法都能够有效地探测出真实的聚类个数,并且得到正确率较高的聚类结果。此外,这些k-means算法也可以应用到非监督图像分割的领域。   直线检测在图像处理和模式识别中有着重要的作用。本文中,我们将直线的单位方向向量和直线上某一点作为描述一条直线的参数,提出了一种可用于直线检测的有限混合模型,并证明了该模型在其定义域上是一个概率模型。根据EM算法的思想,我们建立了直线检测的不动点EM算法。实验结果表明,在数据集中直线数目已知的前提下,我们提出的不动点EM算法在不同的噪声水平下都可以检测出真实直线。该算法不仅适用于两条直线相交的数据集,而且在多条直线相交于一点的数据集上也能够有效地检测出直线。然而,不动点EM算法存在着两个限制:一、算法中的直线数目与真实的直线数目必须相等;二、该算法在一定程度上依赖于参数初始值的选取,容易导致计算结果陷入局部解。   为了克服不动点EM算法的限制,在有限混合模型的基础上,我们引入了BYY和谐学习机制和BYY和谐函数,并建立了BYY模拟退火算法。该算法不需要事先知道直线的数目,只需要满足直线数目大于真实的直线数目的假设。同时,在算法中,我们引入了退火因子。通过退火因子的动态变化,可以寻找到BYY和谐函数的全局最大值。实验结果表明,BYY模拟退火算法能够有效地克服不动点EM算法的限制。在直线数目大于真实值的情况下,该算法可以将多余的直线自动排除,从而检测出数据集中所包含的真实直线。与不动点EM算法相比,尽管在时间上需要付出更多的代价,但其检测的准确性有了显著的提高。
其他文献
李建生的长篇小说《红尘》把现实生活中的真实画面多方位立体地以艺术的真实再现给读者,为我们塑造了一组典型人物。他塑造的典型,既具有突出的共性,又有鲜明的个性特征,且能
在过去,人们对广义KPP方程的整体吸引子及解的爆破性已有一些重要的结论.文章主要分以下四章对广义KPP方程的整体吸引子及解的爆破性进行研究:   在第一章中,主要介绍了广义K
学位
学位
生态系统的复杂性是当今一个具有重要理论意义和实际应用背景的研究课题。它与相关的混沌理论相结合,更为深刻而全新地揭示生物学中许多令人迷惑的现象。  本文对几类捕食
学位
学位
学位
学位
学位