论文部分内容阅读
本研究关注单维和多维测验情况下,针对类别数据进行测量等价性检验时的方法比较,以及样本总量、样本量组间比例、测验长度、阈值差值、维度相关、维度相关差值诸因素对于各检验方法的影响,和检验方法的一类错误率。研究结果如下:
一、在单维测验下进行阈值的测量等价性检验时,DIFFTEST、IRT-LR两种方法均随着项目阈值差值的增加、样本总量的增多、样本量组间比例接近于1而平均检验力提高。而随着测验长度增加,DIFFIEST检验力下降,IRT-LR检验力则提高;
二、在多维测验下进行阈值的测量等价性检验时,DIFFTEST、BMIRT-MG两种方法均随着项目阈值差值的增加、样本总量的增多、样本量组间比例接近于1而平均检验力提高。而随着测验长度增加,或维度相关的增加,DIFFTEST检验力下降,BMIRT-MG检验力则提高;
三、在多维测验下进行维度相关测量等价性检验时,DIFFTEST和BMIRT_Zr随着样本总量的增多、测验长度增加、维度相关差值的增加而平均检验力提高。
四、一类错误率方面,在单维测验和多维测验下进行项目阈值组间测量等价性检验,DIFFTEST犯一类错误的概率平均值分别为0.064和0.063,IRT-LR和BMIRT-MG犯一类错误的概率平均值分别为0.0025和0.004。在多维测验下进行维度相关组间测量等价性检验时,DIFFTEST犯一类错误率的平均值为0.060,而BMIRT_Zr一类错误率平均值为0.3。上述三种研究情形下,DIFFTEST、IRT-LR、BMIRT-MG、BMIRT_Zr进行测量等价性检验时犯一类错误的概率,在各种因素水平下没有发现有规律的变化模式。