论文部分内容阅读
概化理论广泛应用于心理与教育测量实践中,方差分量估计是概化理论的必用技术,也是进行概化理论分析的关键。但是,方差分量估计受限于抽样,不同的抽样样本估计的方差分量可能不同。为了保证方差分量估计的可靠性,需要对估计的方差分量变异量进行探讨。
进行方差分量变异量估计需要考虑较多条件,如估计方法、数据分布及样本容量等。本研究仅探讨估计方法与数据分布对方差分量变异量估计的影响。研究分两步进行:第一步为模拟研究。采用Monte Carlo数据模拟技术,探讨四种数据分布下四种估计方法对概化理论方差分量变异量估计的影响,四种数据分布是指正态分布、二项分布、多项分布和偏态分布,四种估计方法是指Traditional方法、Jackknife方法、Bootstrap方法和MCMC方法,方差分量变异量是指方差分量标准误和置信区间;第二步为实测数据验证。用一批实验心理数据和一批心理测验数据对模拟研究所得的结论进行验证。
分析工具为R软件、WinBUGS软件、R2WinBUGS软件包、Coda软件包和HyperbolicDist软件包,借助这些软件或软件包,自编完成研究程序。设立两种比较标准用来比较各种估计方法的性能:一是方差分量及标准误估计的比较标准,为“偏差”(bias),偏差越小,估计越准确;二是方差分量置信区间估计的比较标准,为“80%置信区间包含率”(80%confidence interval coverage),包含率越接近0.80,结果越可靠。
通过分析正态分布、二项分布、多项分布和偏态分布数据四种方法估计的方差分量及其变异量结果,可以得出以下结论:
第一,数据分布对方差分量变异量估计有影响。不同数据分布下,各种估计方法的“性能”表现出差异性:对于正态分布数据方差分量变异量估计,Traditional、Bootstrap和MCMC方法较好,Jackknife方法较差;对于二项分布数据方差分量变异量估计,Bootstrap方法较好,MCMC方法尚可,Traditional和Jackknife方法较差;对于多项分布数据方差分量变异量估计,Bootstrap方法较好,Traditional、Jackknife和MCMC方法较差;对于偏态分布数据方差分量变异量估计,Bootstrap方法较好,Traditional和MCMC方法尚可,Jackknife方法较差。
第二,Bootstrap方法具有方法的“跨分布性”。通过对比四种方法的“性能”,发现仅Bootstrap方法在四种数据分布下方差分量变异量估计都较好,表现出方法的“跨分布性”。但是,没有任何一种Bootstrap策略能够较好地估计三个方差分量的变异量,Bootstrap方法需要使用“分而治之”策略。
第三,Bootstrap方法“分而治之”策略具有“统一规则”。在各种数据分布下,估计三个方差分量变异量使用的“分而治之”策略有所不同。比较发现,不同数据分布下。Bootstrap方法“分而治之”策略具有“统一规则”:对于p的方差分量变异量估计,boot-p策略最佳;对于I的方差分量变异量估计,boot-pi策略最佳;对于pi的方差分量变异量估计,boot-I策略最佳。
第四,“统一规则”Bootstrap策略校正的方法较好,PC和Bca方法相当。Boot-p、boot-pi和boot-I策略使用校正的和未校正的方法分别估计p、I、pi的方差分量标准误和置信区间,结果表明校正的方法较好。同时,考虑到校正的方法点估计优于未校正的方法,认为使用校正的方法更为妥当。Boot-p、boot-pi、boot-I策略使用校正的PC和校正的Bca方法分别估计p、I、pi的方差分量置信区间,两种方法结果相当,都相对较好。
第五,通过“模式验证法”,实测数据有效地验证了模拟数据所得结论。其中,“1=2=3=4”模式验证了方差分量的等价性;“1=3=4”模式和“1=2=4”模式验证了数据分布对方差分量变异量估计有影响;“1=3=4”模式表明Bootstrap方法处在“优”之列,“1=2=4”模式表明Bootstrap方法不处在“不优”之列,说明Bootstrap方法具有方法的“跨分布性”;某些Bootstrap策略估计某个方差分量变异量在不同数据分布下都较好,如boot-P估计P的方差分量变异量较好,表明Bootstrap方法“分而治之”策略具有“统一规则”;两批实测数据的结果也表明“统一规则”Bootstrap策略校正的方法较好,PC和Bca方法相当。