北京市高中会考数据挖掘研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:pigyufish
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
北京市普通高中毕业会考作为以测量和评价高中学生学业水平、学校教学质量为主要目的大规模考试,属于标准参照性考试,它是衡量普通高中学生是否达到毕业标准的依据。随着数据库系统在会考管理中的广泛应用,北京教育考试院积累了大量与会考相关的数据。由于缺乏有效的处理手段,这些数据在业务活动结束后成了难得再访问的数据档案。将数据挖掘技术引入高中会考数据分析中,对沉积的数据进行分析,找出背后隐藏的知识,发现数据中潜在的规律,从而为科学评价高中会考在高中教育教学中的作用,为教育行政部门制定相关政策提供数据支持。 数据挖掘成功的关键是确定合适的挖掘目标,挖掘目标的确立既要考虑业务管理的需要,还要考虑已有数据的特性,保证目标在现有数据的基础上是可以实现的。主要目标是通过分析不同考试时间(正常考试、非正常考试)、不同类别考生(普高、私立)、不同考试形式(统一考试、自行组考)的考试分数特性,对现有的政策的修改和完善提供数据支持,从而使北京市高中会考能够真正发挥对教育教学质量的监控和评价作用。 首先,收集整理相关数据,数据主要由会考业务系统产生,为满足挖掘主题的需求可能还需要从其他业务系统获得数据。现有的业务系统主要采用关系数据模型,为挖掘的需要可能需要进行模型转换。其次,需要对原始数据进行清理,去掉异常数据,如空值、不合理的值;还需要对原始数据进行简化,删除与挖掘主题无关的数据。 确定了挖掘目标和对数据进行预处理之后,下面接着是选择合适的满足挖掘需要的挖掘算法,本课题在研究几个重要的挖掘算法的特性、算法的应用方式、算法的实现等方面的基础上,主要研究两类算法:关联分析和分类分析。如何有效利用挖掘算法解决实际问题是研究的重点。 最后,对挖掘得到的结果进行分析,确定其代表的含义,判定是否具有实际意义。
其他文献
传统电算化模式下企业信息系统过于分散且信息化程度低,企业内部控制存在信息传递成本高、内部监督不完善和风险防控难度大等问题.而现代财务共享模式能实现部门和系统间的信
研究以20种不同基因型水稻的成熟或未成熟种胚为外植体,探讨了影响种胚愈伤组织的形成和植株再生的主要因素,建立了1191个(丛)水稻体细胞无性系,大多数体细胞无性系(SC_1)的
本文通过盆栽研究了沙打旺水肥协同效应.结果表明,肥料的增产效应皆随水分量的提高而增加;在低水分时,肥料增加到一定水平出现负效应,在高水分还末出现负效应;在水肥协同效应
随着计算机网络在政治、经济、文化、生活等诸多方面的广泛应用,网络已经成为日常工作、生活中不可缺少的重要组成部份。与此同时,网络安全问题也凸现出来,并逐渐成为网络应
随着通信技术的快速发展,越来越多的通信设备成为具有Wi-Fi、3G、蓝牙、红外等多个接口的多宿主终端,然而,传统TCP协议只能使用端系统之间的一条可达路径传输数据,为了充分利用多
近年来,计算机技术和互联网技术的迅猛发展,有力地推动了社会进步。计算机网络已经渗透至社会各个领域,成为人们工作和生活中必备的工具之一。然而与此同时,计算机网络的安全
DVB(Digital Video Broadcasting,数字视频广播)是数字电视的标准。基于DVB标准的数字广播系统已在卫星、有线、地面等传输媒介中广泛部署。IP是互联网中的核心协议,IP over
我国是煤炭生产大国,但存在严重的煤矿安全生产问题(如矿井火灾、瓦斯爆炸等),造成大量的人员伤亡和财产损失。要保证煤矿工作人员的安全,需要对他们进行安全教育、救生训练
Ad Hoc网络是一个无需架设固定网络设施的多跳、自组无线网络。从初期的军事通信中的应用,Ad Hoc网络技术现在已经逐渐的被使用在商业通信中。随着多种网络业务的开展,在Ad H
期刊