论文部分内容阅读
在实际生活中,我们往往要建立许多的经济模型来分析隐藏在经济现象之后的数量经济规律。通过一种形象、生动的数学语言可以把众多影响因素之间的复杂关系模拟出来。这些影响因素一般表现为经济变量,按照它们之间的因果关系来划分,可以分为解释变量和被解释变量。在对这些经济变量进行实际取值时,也存在着许多种数据类型,其中面板数据在实际研究中使用最为广泛。它包括了许多个单位个体在不同时间下的观测值,从横向看,它是截面数据,从纵向看,它又是时间序列数据,因此它能提供许多截面数据和时间序列数据不能提供的动态信息。既然面板数据是关于不同时间下不同单位个体的数据,在这些数据中肯定存在着某种异质性,既包括了时间的异质性也包括了个体的异质性。因此,在对面板数据分析过程中,解释变量可能会以显著不同的方式来影响被解释变量,其中有一些解释变量在所有个体中都表现为异质的,但另一些解释变量在所有的个体中则表现为同质的。如何有效的区别这两种不同的效应是非常重要的,特别是在高维面板数据的情况下,它能够帮助人们更加准确地理解和解释隐藏在这些数据后的模式。为此,本文提出了一个新颖并且有效的马尔可夫链蒙特卡罗(MCMC)算法,它不仅特别适合高维数据下的面板模型,而且能够同时进行系数的估计和模型的选择。虽然异质效应能够反映时间上的差别,但在现实中,人们最感兴趣的模型是能够考虑到随着不同个体发生变化的异质效应。在这篇文章中,我们假设对于不同的个体存在着异质效应,但是不对时间的异质效应进行考虑,也仅仅是在一个线性回归模型的框架中去分析研究这个问题,但是不管是个体的异质效应还是时间的异质效应都可以通过类似的方法来得到解决,只要对模型进行合理的设定,以及数据进行合理的排列就能保证所得到的结论不会发生改变。当数据不支持斜率系数固定不变的假设,允许不同的横截面个体的参数发生变化,以便将个体的异质性纳入考虑范围,这对于建立一个具有科学理论依据的计量经济模型来说是合理的。基于已有文献中对模型的选择,我们设定了一个分层贝叶斯混合模型。这里的分层主要是指模型中解释变量的系数会服从于一个指定的多元正态分布,而在这个多元正态分布中,其协方差矩阵中的元素假定服从于逆伽马分布。当使用简单的贝叶斯方法时,有可能会导致所有参数的复杂的联合分布,而分层贝叶斯模型的设定,则能够避免这个问题。在这里,我们假设单位个体的特殊效应可以通过一个随机系数来表示,也就代表了个体的异质效应。人们在面对真实的数据集时,事先并不知道同质效应或者异质效应的决定因素是什么。作为出发点,我们先暂时假设所有的变量都反映异质效应。根据分层贝叶斯的结构体系,以及一些简单的计算推导,我们认为,如果E(αjj)=0,1≤j<≤k,那么相应的解释变量的系数就是一个固定不变的常数,不会随着单位个体的变化而发生变化,这说明解释变量的系数反映了同质效应,也就是解释变量对所有的个体都是同质的。因此为了检测同质效应,我们只需要重点关注多元正态分布中协方差矩阵的元素。通过贝叶斯理论的一些基本运算,我们得到了关于多元正态分布中协方差矩阵元素的如下推论:如果模型中的解释变量是反映异质效应,则其对应的协方差矩阵元素显著不为0,若相应的协方差矩阵元素接近于0,则表明是同质效应的解释变量。由此,我们得出了如何对模型中反映同质效应的解释变量进行判断的方法。接下来,我们根据MCMC算法提出了一种抽样过程,按照这种抽样过程,经过多次的重复迭代,我们可以得到相应的协方差矩阵元素的取值,并且也能够将其后验均值估计计算出来。这样,我们就可以将模型中反映了同质效应的解释变量检测出来。对于模型中其他的变量,我们也采用同样的方法去计算后验均值估计,一旦根据我们的判定标准,认定解释变量的系数反映了同质效应,我们就用所有个体的均值作为估计值去代替解释变量系数的估计值。基于所得到的后验均值估计,我们应该对第j个解释变量是同质效应还是异质效应做出论断。也就是,如果其对应的值很大则说明反映了异质效应,若其取值接近于0则意味着同质效应。通过一些直观的推导,我们提出了确定相应的协方差距阵元素临界值的方法,也就是同质效应的评判准则。在随后的蒙特卡罗模拟中,我们对其进行了大量的模拟,结果表明这个简单的准则是非常有效的。为了评估MCMC算法的性能,我们使用了蒙特卡罗模拟方法。按照样本规模和预测维度的不同,设定了三种不同的模型,分别代表了面板模型中不同的数据特征。模型1处理的是典型的时间较短而个体观测值较多的数据,模型2是平衡面板数据,即时间和个体的数量是相同的,模型3则是高维数据类型。对每一个模型,我们模拟了100个数据集,而且对于每一个数据集,我们的抽样次数为1000次,最初的500次被视为“燃烧期”,其迭代结果需要舍弃掉,也就是说,我们利用后面的500次样本序列来做出推断。真实模型中反映同质效应的解释变量的集合与根据我们的标准判定的模型中反映同质效应的解释变量的集合存在三种关系,分别是准确拟合,欠拟合和过拟合。比较分析上述三个不同模型在100个数据集中准确拟合、欠拟合和过拟合的百分比,可以对同质效应判定标准的准确性进行评估。结果表明,不管模型的样本规模和预测维度如何,即使是在处理高维数据的面板模型中,准确拟合的程度也是非常高的。这说明我们之前所提出的对同质效应的判定标准是非常准确的。接下来,我们也对MCMC算法的准确性进行了评估,对相对误差的绝对均值做出了一个定义,采用不同的系数来评估同质效应和异质效应,并给出了上述三个不同的模型系数检验的模拟结果,所得到的估计值都很小,因此可以认为MCMC算法的准确性非常高。在公司金融领域和资本市场中,一个公司的盈利能力通常由净资产收益率(ROE)来衡量。许多对公司基本价值的分析都是以此为基础来判断股票的投资价值,因此准确的预测ROE是非常关键的。正如我们所知,在公司的财务报表中包含了许多关键的数据,基于公司本年度的报表去预测下一年的ROE,建立一个这样的模型是很正常的。但是公司财务报表与ROE之间的内在联系可能会非常复杂,并且,财务报表由许多的会计变量所组成,我们必须找到能够对ROE产生重要影响的相关因素,并对此进行研究分析。因此一个普通的模型难以捕捉到如此复杂的关系,这就促使我们运用前文提出的MCMC算法去研究公司下一年的ROE与本年度报表之间的关系。在本文的最后,我们选取了在上海证券交易所上市的所有A股公司为样本,运用MCMC算法来考察公司下一年的ROE与本年度报表之间的关系。基于变量的可度量性以及数据的可获得性,我们选取了公司当年的ROE、总资产周转率,营业利润率,资产负债率和公司的规模作为解释变量。实证结果表明,在上述影响ROE的多个变量中,变量的同质性从强到弱依次是:公司规模、总资产周转率、当年ROE、资产负债率、营业利润率。这说明我们所提出的MCMC算法是有效的,能够将具有同质效应的解释变量检测出来。