英文作文智能评改中词性标注技术的研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:jskrrockboy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着对外开放的不断深入,我国英语学习者的数量急剧增加,对英语学习者的文章进行相关分析研究显得日趋重要。英文作文智能评改系统综合利用自然语言处理、统计学、语料库语言学与信息检索等技术,旨在为中国英语学习者提供优良的学习途径,提高学习者的写作能力。系统针对中国英语学习者的写作特点进行设计与实现,充分考虑中国英语学习者在写作时的语法错误、中式英语与在母语思维影响下的特有写作特点等。面向中国学生英语作文的词性标注是对中国学生英语作文实现自动批改的基础,虽然研究者对英语词性标注做了大量有益的研究,但是大多数的研究都是面向以英语为第一语言的用户所写的英语文本,而面向中国学生英语作文相关研究则很少。本文对中国学生的英语作文进行人工标注,并提出了一种面向中国学生英语作文的词性标注算法,该算法融合了词聚类、无标语料统计信息、单词发音等丰富特征,并在标注好的14022个句子上训练得到模型,实验结果表明该算法能够有效提高标注性能,标注正确率从94.49%提高到97.07%。通过改进词性标注系统,英文作文智能评改系统对学生英语作文中语法错误检测的效果得到了提升。
其他文献
该文提出了采用ADOMD模型设计基于Web的联机分析处理系统的原型,大大缩短了开发系统的时间并快速的验证系统的合理性;提出了基于Web的访问多维数据集的接口技术,根据投资系统
该论文参考当前国际上关于网格信息服务的最新研究成果,以西安交通大学校园网为实验环境,设计了一个校园级网格信息服务系统C-GIS,并且主要基于LDAP技术给出了C-GIS原型系统
该文所讨论的内容有:☆ 研究了领域层的持久类与关系型数据库之间的映射策略.领域层的类与关系数据库的表的映射不仅仅包含了数据的映射,还包含了类之间关联的映射.我们根据
公钥密码思想被第一次提出后,新颖的方法和思路在公钥密码思路的基础上得到了发展和提高。无论是国外还是国内,也相应地、不断地提出了很多新的关于公钥密码体制的实现模型,
该文首先简要地介绍了搜索引擎的发展状况、工作原理、分类,总结了当前的搜索引擎存在的问题,展望了搜索引擎发展的趋势,分析了主题搜索引擎出现的必然性.接着,论文较为详细
原来的一些性能分析工具主要是为集群规模的并行计算环境开发的,已经不适应于大规模的分布式并行计算环境,因此该文从分布式的角度出发,利用CORBA为分布式计算提供的强大支撑
论文详细研究了GPRS网络的体系结构;协议;QoS机制以及保证QoS前提下GPRS网络协议的应用.论文首先从无线移动通讯入手,介绍了无线网络体系结构及相关协议,进而分析了无线网络
该论文通过对首都机场自动广播系统的现状分析,总结了以往系统的可取之处和不足之处,并结合对乌鲁木齐机场自动广播应用需求的分析,提出了通用数字自动广播系统的功能需求与
首先,文中论述了三种典型的分布式VoD服务器(层次型DVS、网状DVS和基于集群服务器DVS)的节目存储和轮换策略.其次,经对中山大学软件所VoD系统的用户点播数据进行细致分析,发
该文所介绍的实例CRP是一个适合中小学校园资源管理的一个平台,它包括了学籍管理、成绩管理、排课管理等各个管理子系统,为校园办公和资源管理提供信息化解决方案.该文介绍了