Angoff標準設定法的理論與實務探討

来源 :中国心理学会,中国教育学会 | 被引量 : 0次 | 上传用户:zcat16
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  近年來,華語地區的公開考試或測驗漸有改採用標準參照型式的趨勢,並委由學科專家及教師進行標準設定的程序,考生在各科獲得的成績皆以等級方式作為報導,有鑑於該等測驗有部份為高風險的測驗,測驗結果對考生會有不少影響,因此進行時必須十分謹慎。雖然學生參加測驗或考試之後,負責測驗的單位對學生的表現進行標準設定的任務,在實務上已約有七十年的歷史,但在相關文獻中,比較缺乏對標準設定背後的理論進行討論,因此標準設定的模式並不十分清晰,大部份文獻主要著重於發展設定切割分數(或劃界分數)的方法,其探索的內容多偏向實務考量為主,著眼於討論執行時各項應注意的原則,而且提出非常眾多設定切割分數的方法(Cizek&Bunch,2007),因此華語社會的公開考試在標準設定方面應如何進行,才會對考生更為公平,尚有進一步探討的空間。
其他文献
目前我国高考和中考大型测试物理学科试题功能的测评,停留在对试卷题型结构、内容结构和能力结构方面分析,缺少对学生认知维度分析。本文采用结构方程模型(SEM)方法,对2012年大连市中考物理测试数据进行探索性(EFA)和验证性因子分析(CFA),得到了影响测试题目的三类因子(F1、F2、F3)、因子所包含的题目和模型结构。根据对试题定性分析得到三个因子分别应为记忆、理解与简单应用、问题解决,与国际科学
中考作为大规模、高利害考试,试卷质量的科学性和公平性,不仅直接影响到考生的切身利益,而且也影响到考试的权威性。现阶段国内对试卷的评价主要是基于经典测量理论,对试卷的内容效度、信度及试题的难度、区分度进行分析。本研究在以往研究的基础上,增加对试卷预测效度的考察,并对项目功能差异(DIF)进行检验。本研究以广州市2015年中考思想品德(简称“思品”)试卷为例,旨在探讨如下两个问题:(1)考察试卷的内容
在2012年,1953名15岁的上海初中九年级孩子,既参加的上海初中毕业统一学业考试(简称中考)数学科目的测评,又参加了PISA数学笔试的测评.本论文得到上述两个数学测评成绩的相关性为0.71,同时利用回归分析,分析了PISA数学测评成绩、两个测评在测评框架内容及过程领域上的差异对中考数学成绩离散程度的解释率.本论文得到PISA数学成绩,对上海初三15岁群体的中考数学成绩差异的解释率只有51%,两
随着云技术、大数据技术在教育领域的广泛云用,考试数据已成为教育评价的重要依据。有效利用考试数据对学生学业状况进行分析,全面客观地评价学生的学业状况。考试数据是检验教师教学情况的量化指标,更是指导教师教学的重要依据。目前,教育部门以及学校老师对考试数据本身所提供的信息挖掘不够,只看到了考试成绩的平均分,及格率和优秀率,反馈给学生的也只是各科的总分或每小题的得分情况,而没有进行更深层次的分析。
中国是考试大国,然而泄题、替考、抄袭等恶性作弊事件层出不穷。显然,依靠考前的防范措施不能有效杜绝,应引入统计手段进行试后甄别。现有的利用统计手段进行作弊甄别的方法可归结为两类,答案抄袭(AnswerCopying)检测法和个人拟合(Person-Fit)检测法。相比于个人拟合检测法,答案抄袭检测法所对应的理论假设与答案抄袭直接相关,且有更高的检出率,在作弊甄别领域有着更为广泛的应用。但是,答案抄袭
认知诊断是新一代教育测验理论的核心部分。认知诊断测验要实现认知诊断功能,离不开认知诊断模型,据统计,到目前为止,已开发了近百种认知诊断模型,每种认知诊断模型都有其适用范围,且各有其优缺点。广义距离判别法(GDD)(孙佳楠、张淑梅、辛涛和包钰,2011)的本质是利用项目反应理论(IRT)下两参数逻辑斯蒂克模型(2PLM)的项目特征函数对观察反应模式(ORP)与理想反应模式(IRP)之间的海明距离进行
信度是评价测验结果稳定性、一致性的重要指标,基于认知诊断测验结果是将被试分类的特点,有学者将标准参照测验的基于列联表的信度指标引入到认知诊断当中,开发出认知诊断的属性信度指标,主要有Templin的属性重测一致性和Wang的属性分类一致性。以DINA模型为例,对Templin的属性重测一致性指标和Wang的属性分类一致性指标进行改进,比较改进前后的属性信度指标的性能,并且将标准参照测验中基于列联表
在认知诊断评估中,用于诊断分类的方法多为参数模型,参数估计的实现需要具备一定的数学和计算机知识,较大程度地限制了认知诊断评估在实践中的应用和推广。近年来,研究者开始将非参数方法引入到对被试知识状态的诊断与分类中,因其具有无需前提假设、操作简单、耗时少、不依赖于样本量等特点,适于认知诊断评估的应用和推广。非参数方法中,基于观察反应模式(Observed Response Pattern,ORP)与理
认知诊断理论的出现是为了更好地对学生的认知结构进行诊断和分类,以便教师能对学生的不足做出补救教学.现有的认知诊断理论以具体的认知模型为基础,大部分认知诊断模型均是利用参数方法对被试的认知结构进行判别,而近几年来,由于非参数诊断方法的兴起,人们逐渐认识到非参数方法的优越性,由于非参数方法与参数方法相比具有以下优点:(1)样本量大小对其估计精度值影响不大;(2)属性层级关系对非参数判别方法的判准率影响
考试作弊一直是考试应用中难以回避的问题。随着考试作弊现象的日益严峻,我国已经越来越重视对考试作弊的侦测与查处。然而,无线通信技术的发展,催生了集团式的跨考场作弊,使得抄袭者能够超越物理距离的限制,严重威胁考试公平。国外已有的关于考试抄袭的研究,针对的是考场内相邻的考生,尚来有研究涉及跨考场抄袭的情境。国内已有研究对不同抄袭统计量的抄袭效能进行了比较,考虑到了跨考场抄袭的情景,但还来有研究基于统计性