【摘 要】
:
本文在拓广分部评分模型(简称GPCM)中,设计两种多级评分模型下的题库。题库1为模拟产生400个项目,项目的每个步骤参数都服从标准正态分布;题库2为模拟产生400个项目,其中300个项
【机 构】
:
赣南师范学院数学与计算机学院,赣州,341000
【出 处】
:
第十届海峡两岸心理与教育测验学术研讨会暨全国教育与心理统计测量学术年会
论文部分内容阅读
本文在拓广分部评分模型(简称GPCM)中,设计两种多级评分模型下的题库。题库1为模拟产生400个项目,项目的每个步骤参数都服从标准正态分布;题库2为模拟产生400个项目,其中300个项目的步骤参数服从标准正态分布,50个项目(占总数的1/8)服从[-3,-0.6]之间的均匀分布,50个项目服从[0.6,3]月之间的均匀分布。通过Monte Carlo模拟实验表明,在定长测验下,题库2下被试的测验精度和项目的曝光率都比题库1要好,且在题库2下,估计的精度在各个能力点上表现得更加平稳。通过本文的研究结果,在多级评分模型的CAT中,题库中适量的增加综合难度较高和较低的项目,可取得较佳的测验效果.
其他文献
Bootstrap方法是一种有放回的再抽样方法,该方法被认为是统计学上的新突破之一.Bootstrap方法的BCa方法和ABC方法既具有“可转换性”,又具有“二阶准确性”。为方便与其它方法
古巴老百姓都直呼其名 在古巴,老百姓喜欢谈论他们的领袖卡斯特罗,都亲切地叫他“菲德尔”或“我们的司令”,而不是称他“主席”或“书记”。古巴媒体也是如此,除非发布非常正式的官方新闻,一般都称呼他“司令”或“总司令”,有时干脆直呼其名——“菲德尔”。 起初,我觉得很别扭,问过很多古巴人:“你们这么称呼国家元首是不是太不礼貌?”而几乎所有古巴人的第一反应都是一愣,然后说:“我们历来这么称呼他。”
本研究的研究材料是该考试正式考试的3份试卷,选择适用于多级记分测验的等级反应模型,使用同时校准法、固定共同题参数法和链接独立校准法中的平均数标准差方法、平均数平均数
(1993年10月24日一届二次理事会会议通过)顾问:陈敏章曹泽毅董建华吴阶平马旭彭司勋陈文杰理事长:王镭副理事长:刘海林程伯基严世芸李荟元常务理事:(以姓氏笔划为序)万德光文历阳王谦
将题组GIRM (Testlet Response Thoery)方法和传统GT(Generalizability Theory)方法应用于实际研究,通过对实测数据进行分析,将题组GIRM方法与传统GT方法进行对比,来探讨题
本研究使用由“国际数学和科学评测趋势”改编的中国学生数学和科学素养测试中的小学生科学素养测验部分,根据全国代表性学生样本的实际作答,对量尺化测验矩阵设计的垂直量尺化
IRT方法是继Thurstone方法之后用于垂直等值的比较常用的一种方法。采用IRT方法必须满足两个前提假设:(1)测验在每个年级上都具有单维性,(2)各年级间测验结构相同。MIRT模型能
本研究分为两个模拟研究。研究一以2009年和2010年科学学科监测的实际试卷结构和题目参数为基础,在共同题等值设计下对四种多维IRT等值方法进行了比较。研究二以更普遍的多维
小南郢渡槽是引江济淮工程小合分线上的3座渡槽之一,地处肥西县莲花圩区,存在地质条件较差,地形复杂等天然不利因素,同时渡槽上部结构及水重荷载较大,因工程安全运行需要,需
1993年12月份全国疾病监测点35种法定传染病疫情动态简介1995年《疾病监测》杂志合订本征订启事1993年《疾病监测》杂志合订本(1~12期)将于1994年2月装订成册,每册20元(含寄费),订阅者邮局汇款,100050,北京市天坛西里10号