论文部分内容阅读
似乎不相关回归模型(seemingly unrelated regressions model SUR)是由多个回归方程组成的方程组,它与多元回归模型的区别在于允许各方程存在不同的自变量,这样的特性给统计建模带来很大的灵活性。同时,SUR在参数估计过程中利用了方程间误差向量的相关信息,使参数估计效率在满足某些适当条件下较之对各个方程分别进行参数估计的传统方法得到改进。
基于贝叶斯方法的似乎不相关回归模型,采用Jeffreys的不变先验,可以得到良好的估计与预测效果,从而受到各领域研究的重视。本文首先探索了似乎不相关模型的基本结构,应用贝叶斯参数估计和非参数估计方法,其中参数估计中分别采用了Gibbs抽样和直接蒙特卡罗(DMC)抽样,通过模拟数值例子和实际数据比较了这两种方法在应用上的优势与不足。而贝叶斯非参数估计结合了Gibbs抽样,Metropolis-Hastings(M-H)算法以及改进的焦点抽样,比单方程非参数估计更有效地对模拟数据作出良好的估计。
应用Gibbs抽样和直接蒙特卡罗(DMC)方法的结果显示,这两种抽样方法得出的参数后验均值,贝叶斯后验密度,未来值的预测密度以及其它相关的后验量(如后验置信区间)都很接近,但从平均绝对误差结果来看直接蒙特卡罗(DMC)抽样比Gibbs抽样得出的估计好一些。另一方面Gibbs抽样使用起来会有风险,如Gibbs抽样需要进行预迭代,检验收敛性和设定初始值等,这些问题并不会出现在DMC方法中,相比之下,DMC方法可直接提供计算结果,使用起来更加的简便。1992年空气质量数据原本用于建立贝叶斯分层模型,本文尝试用此数据建立了SUR模型,并将贝叶斯分层模型与SUR模型的结果相比较,很明显地可以看出,SUR模型得出的拟合值比贝叶斯分层模型得出的结果更加接近于真实数据。
在非参数估计中,本文提出一个贝叶斯分层SUR模型,使用较大的函数系集合,包涵许多理想的函数特征,未知回归函数用它们的后验均值来估计,对于基函数的每个子集都能达到适当的后验概率。这种非参数估计具有较好的灵活性和光滑性。本文模拟正相关一元SUR与不相关SUR数据,将非参数SUR估计与单方程非参数估计进行了对比,结果表明,当方程存在相关性时,非参数SUR估计显著地优于单方程非参数估计,因为后者忽略了不同方程之间的相关性;当方程不存在相关性时,由非参数SUR方法得到的函数估计与单方程非参数方法得到的估计非常接近。本文还建立了1988年加利福尼亚州黑人,白人对数-负对数转换的围生期死亡概率和特定出生体重的SUR模型,由于两方程间存在极强的相关性,因此此时采用非参数SUR估计显著地优于单方程非参数估计。
因此,无论多个方程间是否存在相关性,可通过建立SUR模型,采用贝叶斯方法不仅可得出良好的结果,也得到了方程间的相关程度。