论文部分内容阅读
概化理论是现代心理与教育测量的主要理论之一,应用实验设计及方差分析方法,可对心理测量的总变异进行分解。概化理论较经典测量理论的最大优点是可根据一次观察的结论推论至更宽广条件下的测量效果,该效果用可靠性表示,根据测验的不同目的区分为概化系数Eρ2和可靠性指数Φ。故可靠性应成为概化理论研究者关注点之一。
对概化系数和可靠性指数的估计类似于点估计,报告估计值的同时也需报告与之对应的变异量(标准误和置信区间)。但对概化理论下可靠性的研究多止于得出概化系数或可靠性指数的大小,少有关于可靠性估计值的探讨。概化理论G研究时所选择的数据形态、实验设计及估计方差分量时所用的估计方法等因素都会对D研究中的概化系数和可靠性指数的估计值产生影响,但究竟有何种影响、影响程度如何尚不明确,本论文对这一问题进行理论探索,对概化理论中的可靠性研究进行补充,也提供新的研究方法与思路。
在正态p×i设计下,采用数据模拟技术,设置多种样本容量,用traditional法、Bootstrap法、Jackknife法对可靠性及标准误进行估计;并用traditional法、Bootstrap法、Jackknife法、Feldt法和Arteaga法对可靠性的置信区间作出估计,得出何种估计方法适合何种样本容量的的结论,并比较各种估计方法的优劣。
对正态p×i设计数据的可靠性研究主要有以下三个方面的结果:(1)对可靠性的估计,总体上traditional法和Jackknife法较好,但当题目数量很小(k=5)时,Jackknife的估计不佳,此时应选用traditional法,当题目数量中等(k=20)或较大(k=50)时,优先选用Jackknife法;(2)对可靠性标准误的估计,总体上traditional法和boot—p、boot—padj法较好,但两种Bootstrap法不适于题目数很小的情况,此时当选用traditional法,当题目数中等或较大时,应选用traditional法、boot—p或boot—padj法;(3)对概化系数置信区间的估计,boot—p法和Feldt法适用于所有的样本容量情况,当题目数中等或较大时也可使用Jackknife法;对可靠性指数置信区间的估计,boot—p法、boot—padj法和Arteaga法的估计值较好,适用于所有样本容量的情况,其他方法的估计值不太理想。