论文部分内容阅读
在数据分析和自动化处理中,高斯混合分布是一种有效的概率模型和分析工具。实际中,我们所遇到的许多数据都可以看作来自于多个高斯分布或总体的混合体。然而,在使用高斯混合模型建模时,如何选取高斯分量的个数,或者说进行模型选择,却一直是一个很困难的的问题。为了有效的解决这一问题,本文提出了一种具有动态合并与分裂操作的自动模型选择学习算法(简称:DMOSL算法)。在DMOSL算法中,我们利用EM算法估计得到的若干个高斯,然后进行动态的合并与分裂操作,依次操作下去便能自动地确定出数据中的高斯及其个数。模拟实验表明,对于一组来自某一个高斯混合模型的样本数据,DMOSL算法能从这些样本数据中自动确定高斯的个数,同时也很好的估计出原始模型的各种参数。另外,我们还利用这个算法来进行了Irisdata的分类,以及用来进行彩色图像的分割,都取得了很好的效果。这些实验结果与应用都证明了DMOSL算法是合理的和有效的。