论文部分内容阅读
在社会学、经济学、教育学、行为学、心理学和生物医学等研究领域缺失数据是非常普遍的,它给数据分析与应用带来很多困难,而现实中又常常需要对具有缺失数据的模型进行参数估计或推断问题。本文首先介绍了缺失数据问题中的一些基本理论,然后基于正态线性回归模型的基础上,当响应变量和协变量缺失时,分别采用基于似然函数的方法和近年来统计学的重要分支贝叶斯方法对参数进行估计。在贝叶斯估计过程中,对于参数的后验分布,涉及难以处理的高维积分,要直接获得参数估计十分困难,因此采用Monte Carlo方法来估计。然而参数的后验分布不是常见分布,我们便采用Gibbs抽样,有的参数的后验分布属于标准分布可以直接抽出,有的参数的后验分布属于非标准分布且比较复杂,为了克服这些困难,我们用了MH抽样。在极大似然估计过程中,一般情况下似然方程不易求其显示解,但可以通过迭代方法求解,本文用了MCEM,及Fisher score迭代算法。在理论研究的基础上本文还通过医学数据进行贝叶斯分析研究。