写作机评原理及应用述评

来源 :校园英语·上旬 | 被引量 : 0次 | 上传用户:yogonet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】本文依据语言测试领域的作文评分要素,对国外具有代表性的三种写作机评系统原理和国内主要的写作机评应用进行评介和比较,指出这些评分系统和软件在评分信度和效度等方面优势和劣势,并分析这些作文自动评分系统为我国自主开发作文自动评分系统所提供的借鉴作用。
  【关键词】写作机评系统原理 写作机评应用 评分要素
  写作自动评分系统对能够提高语言测试的效率和降低成本,本文着重介绍国外内经典的写作机评原理,并简要分析他们的优缺点。
  一、经典的写作机评原理
  1.基于语言形式的机评系统——PEG。PEG于1966年由美国杜克大学的Ellis Page等人开发。PEG的设计者认为作文质量有赖于作文的深层结构,而机器无法直接衡量,因此,他们以文本表层特征项为切入点,间接评价作文质量。
  PEG写作机评分三阶段:变量提取、多元回归分析和把多元回归得到的beta值代入计算机程序换算出作文得分。PEG首先收集了一部分人工评分后的作文,再利用自然语言处理技术,从作文中提取若干个文本特征项,并在这些文本特征项与人工评分之间进行相关性分析。然后,Page选择与人工评分相关的文本特征项作为自变量,把人工评分作为因变量,进行多元回归分析,得到回归方程。回归方程为每一个变量确定了beta值,这样,在对新的作文进行评分时,PEG只需要提取这些变量,并把beta值代入回归方程之中,就可以预测出这些作文的得分。PEG目前的程序中包含很多复杂的变量,但PEG的开发者们并没有对这些 “复杂的变量”作出明确的界定。
  2.基于内容的机评系统——IEA。IEA(Intelligent Essay Assessor)是一种基于潜伏语义分析的作文自动评分系统,由美国科罗拉多大学的Thomas Landauer等学者开发。不同于PEG,潜伏语义分析着重分析文本的内容,而不是语言。
  潜伏语义分析集理论与技术于一体。在理论层面上,它认为任何文本都有一个潜在的语义结构,这一潜在的语义结构即全部词汇的语义之和。然而,自然语言中存在大量的多词同义和一词多义现象,这对我们正确理解文本造成严重干扰。就技术而言,潜伏语义分析属于一种矢量空间模型技术,它可通过降维的方法,有效排除干扰,析取数据中的潜在语义结构。潜在语义结构可由一个词汇项文档矩阵来代表,矩阵中的每行表示一个词汇项,每列表示一个文档,而矩阵的每个单元格中的元素为相应词汇项在相应文档中出现的频数。
  运用矩阵代表潜在语义结构,可进行奇异值分解的矩阵运算,通过该运算,原来的矩阵可以被分解成为三个不同的矩阵。降维后,对这三个矩阵展开进一步的运算。该矩阵保持了原来矩阵中最重要的语义联想关系,同时又屏蔽了大量的干扰信息。
  将潜伏语义分析用于学生作文自动评分时,待评分的作文与范文均被视作矢量,完成矢量间的比较后,可得到每篇待评分作文与范文在内容上的相似度评分。根据Landauer等人的报告,该系统所评出的作文得分与人工评分之间的相关性达到r=0.85。
  3.基于层次结构的机评系统——E-rater。E-rater是由美国教育考试处于20世纪90年代开发,其目的是评估GMAT考试中的写作水平。该系统利用了多项技术,其中包括统计技术、矢量空间模型技术和自然语言处理技术。因此,它不仅能像PEG那样评判作文的语言质量,还能像IEA那样评判作文的内容质量。另外,E-rater还可分析语篇结构。类似于PEG,E-rater的评分方法基于线性回归模型。E-rater围绕三个层面评析作文的质量:第一层为话语结构(亦即篇章结
  构),主要靠在文本中搜索“To begin with”、“In conclusion”等篇章衔接词的方法得以实现;第二层为句法多样化,根据作文中句子结构的多样化来评判作文的语言质量;第三层为内容。这里,E-rater通过矢量空间模型,检测作文中是否包含了充足的与作文题目高度相关的主题词。
  研究表明,E-rater与人工评分之间的一致性一直高于97%。但E-rater的三个层次结构中具体包括哪些变量,则是众说纷纭。Kukich报告声称E-rater可析取100多个变量,Power et al.表示E-rater可析取50多个变量,而Attali和Burstein的报告则坚持认为最新版本的E-rater “依据有关理论对写作能力的若干方面给予考虑”,只提取12个变量。
  二、有代表性的写作机评应用
  1.国外主要英语作文自动评价工具软件。国外最有代表性的写作机评应用当Writing Roadmap 2.0(WRM 2.0)。著名学者吴一安和唐锦兰考察了机评系统WRM 2.0对高校英语写作教学的影响。学研究表明,学生写作能力、自主学习能力及写作教学过程在一定程度上与WRM 2.0的应用正相关。另外,他们得出结论,写作教学应从关注语言形式和写作结果向关注内容深度和写作过程靠拢。蒋学清等对写作机评系统在大学英语写作中的教学应用研究发现,通过一学期的教学,实验组和对照组的英语写作水平都有了明显进步,且实验组的进步幅度更大。这表明形成性评价方式和具有自动反馈功能的在线写作工具可辅助学习者写作。此外,王淑雯、杨玲结合教学实践,介绍了在写作教学中如何使用WRM 2.0为师生提供多元化反馈,最后阐述了该系统的长处和不足。周颖剖析了WRM 2.0写作机评系统的问题,原因和对策。
  2.国内主要英语作文自动评价工具软件。
  (1)句酷批改网。批改网的核心算法是计算待评文本和标准语料库之间的距离,再将对应的距离映射为作文分数和评语。技术要点是将每一篇输入的作文分解成可测量的192个维度,分析过程充分利用了自然语言技术和机器学习的方法,每篇作文先被自动切分成句子,然后对每个句子进行深层语义分析,从中抽取词、搭配、词组等结构化单元。主要功能包括分数即刻显现、图文报表式作文分析结果抄袭检测等。   (2)冰果英语智能作文评阅系统。它可以即时给出作文评分,并从词汇、语法、文风、内容等方面给出反馈,但该系统目前无法做到对同一篇作文反复修改与评阅。
  (3)TRP( Teaching Resource Program)教学资源平台。它根据写作教学需求,将数字化、网络化与区域化教学平台进行了有机的整合,并涵盖了资源建设、平台构建、写作学习、句型练习、语法测验、作文评分、写作研究与评语生成作为考试等功能。
  (4)易改机评软件。其主要功能包括:1)一键检查:检查英语文本拼写、语法纠错和文章风格等;2)错误解释:对错误类型和错误原因给予详尽的解释;3)写作润色:在维持原意的情况下为文本润色。它采用了基于自然语言处理与机器学习相结合的纠错方法,让机器学习模型大量阅读(一万亿词级别)正确的英语,构建一个极为精确的模型。每遇到一个输入的句子,易改的后端模型会首先分析每个句子结构,然后通过实例语料模型中的上下文来判断写作是否有误。
  (5)大规模考试英语作文自动评分系统 EFL Assay Evaluator 1.0。它结合第二语言习得理论、语料库语言学理论、测试学、统计学,利用自然语言处理技术,挖掘出稳定的文本特征变量,构建评分模型。但该软件在研制过程中仅使用了1000多篇学生作文作为实验样本,与大规模考试中的作文总体样本量差距较大,评分信度较低。另外,它难以判断极具创新性的写作文本的质量,仅适用于对议论文和说明文体的作文进行评价。
  三、结论
  作文自动评分是利用多学科技术来模拟人工评分,从而高效评定作文质量。一个合理的作文自动评分系统应该充分利用统计技术、自然语言处理技术、信息检索技术及其它可能利用的技术,从作文文本中挖掘能够直接反映作文质量的文本特征项作为变量,有效地提高评分模型对作文质量的预测能力。
  参考文献:
  [1]Chung G.,
其他文献
【摘要】本文将理论联系实践,对小学英语课堂教学中存在的主要问题进行分类整理,对教学的影响因素进行深入分析,主要阐述了四大问题:教学过程、教学形式、教学重难点和教师角色等。并根据基础教学目标的要求,对小学英语课堂高效性教学提出改善措施,对小学英语教师提出了新的教学要求,旨在为小学英语教学的有效性提供参考建议。  【关键词】小学英语 有效教学 教学策略  在20世纪的教育科学研究中将“有效教学”理论逐
【摘要】随着社会经济的快速发展,现代教育信息技术也迅速发展起来,逐渐进入学校教育领域,“微课”是近年来在教育领域使用比较广泛的一种现代教育信息技术,“微课”注重实用性,服务于教师的教和学,在课堂教学的每个环节都有一定的体现,可以有效的提高课堂教学效率。本文主要针对微课在小学英语教学过程中的应用进行分析和探究,提高小学英语课堂教学的质量。  【关键词】微课 小学 英语教学  “微课”简单来说就是一种
【摘要】任务型语言教学是落实新课标最有效的教学途径之一。它认为教师的作用是激活学生的内在的知识系统,并提供给学生一个可同时进行探究的环境,来促进学习者的全面发展。在教学实践中通过创设各种情境,培养学生的创新能力、独立思考和独立工作的能力、团队精神和终身学习的能力。  【关键词】新课标 任务型语言教学 形象思维情境 质疑探究情境 团结合作情境 终身学习的能力  一、任务型语言教学的内涵  任务型语言
近日在网上看到一幅14世纪的画作,画中描绘的是一所中世纪的意大利大学,24名学生整齐地排坐在教室里听老师讲课.学生桌前摆着书本,有的学生聚精会神,有的学生无聊发呆,有的学
期刊
【摘要】大学英语教学改革已进行多年,取得了一定的成果,但还存在诸多问题。翻转课堂教学模式的兴起和引入为我国大学英语改革开辟了一条新的道路。通过“翻转”的学习方式,学生的学习态度将发生转变,自主性得到提升,从而学习的效率得到根本性的提高。本文从翻转课堂的优势和其在大学英语课堂上实施的障碍论述入手,着重分析翻转课堂在大学英语课堂中运用的可行性和实施所需的条件。  【关键词】翻转课堂 大学英语 信息技术
杂交水稻技术,解决了中国亿万人吃饭问题;三峡工程成功完成、青藏铁路全线通车、秦山核电站建成并投入使用;“神舟”七号载人航天飞行圆满成功,实现了载人航天工程的重大突破
语法填空题是在一篇200词左右的语言材料中留出10个空白,部分空白的后面给出单词的基本形式,要求考生根据内容填入单词的正确形式;而剩下的一些空则完全没有给出提示,称为无提示词填空。这种形式主要考查学生对语篇的理解和逻辑关系的把握,以及对固定搭配和常见从句、句式等的掌握程度。其中,对语篇理解和逻辑关系的把握,对广大考生的能力要求较高,也是学生实现高分突破的瓶颈。  在英语的句子内部和句子之间使用恰当
本文主要从什么是多元智能理论,多元智能理论对小学英语教学的启示,设计多元的课堂教学活动和运用多元的教学策略四方面进行阐述。 This article mainly elaborates from fo
阅读的过程是对语言的认知过程,阅读有助于巩固和扩大词汇、丰富语言知识、提高运用语言的能力。阅读可以训练思维能力、理解能力、概括能力与判断能力。“侧重培养阅读能力”是教学大纲规定的高中英语教学目的之一,是培养学生理解和运用英语技能的一个基本方法,又是落实交际实践性的主要途径。英语阅读就是读者利用相关的英语知识和非英语知识去解读包含一定英语知识和非英语知识的阅读材料,并从中获得信息的能力,也能培养学生
期刊