类别数据测量等价性检验方法比较及影响因素模拟研究

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:ncepuwade
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本研究关注单维和多维测验情况下,针对类别数据进行测量等价性检验时的方法比较,以及样本总量、样本量组间比例、测验长度、阈值差值、维度相关、维度相关差值诸因素对于各检验方法的影响,和检验方法的一类错误率。研究结果如下:   一、在单维测验下进行阈值的测量等价性检验时,DIFFTEST、IRT-LR两种方法均随着项目阈值差值的增加、样本总量的增多、样本量组间比例接近于1而平均检验力提高。而随着测验长度增加,DIFFIEST检验力下降,IRT-LR检验力则提高;   二、在多维测验下进行阈值的测量等价性检验时,DIFFTEST、BMIRT-MG两种方法均随着项目阈值差值的增加、样本总量的增多、样本量组间比例接近于1而平均检验力提高。而随着测验长度增加,或维度相关的增加,DIFFTEST检验力下降,BMIRT-MG检验力则提高;   三、在多维测验下进行维度相关测量等价性检验时,DIFFTEST和BMIRT_Zr随着样本总量的增多、测验长度增加、维度相关差值的增加而平均检验力提高。   四、一类错误率方面,在单维测验和多维测验下进行项目阈值组间测量等价性检验,DIFFTEST犯一类错误的概率平均值分别为0.064和0.063,IRT-LR和BMIRT-MG犯一类错误的概率平均值分别为0.0025和0.004。在多维测验下进行维度相关组间测量等价性检验时,DIFFTEST犯一类错误率的平均值为0.060,而BMIRT_Zr一类错误率平均值为0.3。上述三种研究情形下,DIFFTEST、IRT-LR、BMIRT-MG、BMIRT_Zr进行测量等价性检验时犯一类错误的概率,在各种因素水平下没有发现有规律的变化模式。
其他文献
针对机动目标拦截问题,设计基于扩张状态观测器的有限时间收敛制导律。首先利用非光滑反馈控制技术,结合有限时间Lyapunov稳定理论,设计了无抖振的滑模制导律。其次为了削弱
去年以来,一些建材采购网站陆续出现.网上建材采购,包括房地产开发企业利用网站的交易平台进行网上建材采购,可以在一定范围内有效地降低原料成本和采购成本,从而降低企业成
澳大利亚的成人社区教育有着悠久的历史渊源和繁荣的发展现状,它是一种以社区为基础,以成人为中心的非正规教育形式。主要面对生活在社区中的最普通大众,尤其对老龄人、移民
随着社会的进步发展,人们发现教育事业是一个国家进步发展的关键因素,而在教师则在教育事业中起着枢纽殷的作用。因此,人们对教师的研究越来越多,也越来越深入,进而提出教师专业化
学位
幼儿数概念的研究在儿童认知发展的研究领域居于非常重要的地位。在这个领域内,也存在许多的争论。最近,Susan Carey等人(2006,2007,2008)提出了幼儿数概念的理解者水平模型,
Pylyshyn和Storm(1988)提出的多目标追踪(Multiple Object Tracking,MOT)范式关注动态场景中视觉信息的注意加工,是研究并行的容量有限的注意机制和研究基于客体的注意机制比
期刊
任何语言都是音、形、义的结合体,但中英文口语词汇的研究和教学均忽略“形”在其中的作用。目前已有少数英文研究者开始关注“形”对口语词汇学习的影响,而关于此主题的汉语
20世纪50年代以来,教师发展已逐渐成为教育改革的中心。随着90年代美国教育家博耶的大学学术理念的诞生,大学教师学术工作性质发生重大转变,世界范围内的大学教师都面临巨大
非符号数量是指用实物或实物记号通过视觉系列(如点阵)、声音系列或者跨感觉通道呈现的数量刺激。对刺激中的非符号数量信息进行解释和表达的过程就是非符号数量表征过程,它