论文部分内容阅读
Dempster,Laird和Rubin于1977年提出的EM算法是一种用于不完全数据情形下进行最大似然估计或最大后验估计的方法。由于具有很好的收敛性质和广泛的应用背景,EM算法一直受到统计学和其它应用科学及工程界的广泛重视。由于概率混合体分布在实际应用中相当普遍并且服从于它的数据可以看作是一种不完全数据,依此建立的EM算法一直受到人们的重视,特别是高斯混合体EM算法。近年来,对于高斯混合体EM算法的收敛性研究有了新的进展。人们发现算法的收敛速度与高斯混合体各分量之间的重叠度有关。当这一重叠度趋向于零时,算法的收敛速度渐进地趋向于超线性,变成为一个快速算法。这与实际应用是相符合的。然而,EM算法能否收敛到正确解一直是一个困难的问题。EM算法的一般收敛理论认为,算法只能收敛到似然函数的一个局部极大解,无法保证能够收敛到与样本的真实参数相一致的解上。但在实际应用与实验中,我们经常发现当重叠度较小时,概率混合体EM算法往往收敛到正确解。本文对高斯混合体EM算法的正确收敛性问题进行了理论研究。首先,我们引入了EM算法,讨论了它的一般收敛性质。进一步给出了高斯混合体EM算法的变形及其收敛性质。