高考考生志愿数据分析与挖掘研究

被引量 : 0次 | 上传用户:cxcsmile
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何填报高考志愿,增加考生被自己心仪院校录取的几率,是每一位高考考生和家长密切关注的问题。目前国内虽然有相应的志愿填报辅助参考系统,然而只是单纯的依据考生成绩或位次进行简单的比较分析,无法从根本上为考生的志愿填报提供有价值的参考信息。鉴于此,本文以某省招生自考办公室招生数据挖掘项目为依托,以该省自实行网络招生以来所积累的近9年海量电子招生数据(其中包含了大量有关考生基础数据、志愿填报数据、高校专业设置与院校录取结果等有用信息)为基础,首先建立招考数据仓库,然后根据志愿主题建立多维数据集,接着利用OLAP技术从多角度、多侧面、多层次对考生志愿数据进行分析,最后利用数据挖掘技术对考生志愿数据进行挖掘,得到一些可资借鉴的结果。本文的工作主要包含以下4个方面:1.完成了历史招生数据的数据清洗本文首先对该省近9年的历史招生数据进行了比较分析,从而发现存在着数据质量与集成方面的问题;然后对电子招生数据代码表进行规范化处理,依据该省招考人员的建议建立高考招生数据代码规范。最后依据代码规范利用SSIS(Microsoft SQL Server 2008 Integration Services)对历史招生数据进行数据清洗、转换,将数据装载至招考数据仓库。2.建立了招考数据仓库本文所涉及的是重庆市科技攻关计划项目“重庆市招生数据挖掘与系统开发”的一部分,该课题系实际应用性项目,因此需要对项目的需求进行科学、合理分析。根据用户需求分析划分相应主题,确定事实度量与数据粒度,设计招考数据仓库模型,最后将清洗后的数据装载至招考数据仓库。3.对高考考生志愿数据进行了多维分析研究本文依据志愿分析主题设计多维数据集模型,从招考数据仓库中抽取相关数据,建立志愿数据立方体,采用OLAP技术从院校/专业报考热度与专业最低录取分两个方面对志愿数据进行多角度分析,得到一些广大考生可资借鉴的结果。4.对高考考生志愿数据进行了挖掘研究本文以考生志愿填报信息为基础,结合高考录取结果,依据CRISP-DM(Cross-industry Standard Process for Data Mining)标准数据挖掘过程建立志愿数据挖掘模型,以研究影响高校录取的关键因素以及录取倾向;最后通过实验,对不同挖掘算法所建立的模型进行对比。实验结果表明,决策树算法建立的模型具有较高的预测准确率,其挖掘结果可为广大考生借鉴。
其他文献
简述了超声波作用的基本原理 ,对超声波在提取植物有效成分中的应用和研究进展进行了综述 ,指出超声提取具有提出率高、速度快且不改变有效成分的结构等优点 ,讨论了超声波提
通过试验采用重铬酸钠与硫酸铵为原料,进行二次焙烧生产冶金级氧化铬绿,探索了硫铵法制得满足高纯金属铬要求的氧化铬绿的可行性。
为了研究大山楂丸粉对肉鸡生长性能及营养物质消化率的影响,试验选择21日龄黄羽肉鸡200只,随机分为4个处理,每个处理5个重复,每个重复10只鸡。对照组饲喂基础日粮,Ⅰ组、Ⅱ组
数学教学既是一门科学,也是一门实用艺术。课程改革给教师的教学带来了生机和活力。教学观念、教学方法、课堂形式都在悄然发生变化。提高小学生对数学的兴趣,调动小学生数学
会议
目的:研究荜茇酰胺对人肺癌A549/顺铂(DDP)细胞耐药性的逆转作用。方法:A549/DDP细胞经0、20、30μmol/L荜茇酰胺作用48 h后,用MTS法检测肿瘤细胞抑制率;流式细胞术检测肿瘤
本文从"自主学习的基本特征""培养大学生自主学习能力的方法"以及"健全大学生自主学习评价体制"三个方面,对大学生的自主学习问题进行了较为深入的探讨。
《指南》指出:教师在幼儿美术教育中应视幼儿为创造的主体,给幼儿创造和自由表现的机会,鼓励幼儿大胆表达情感、理解和想象。美术无声的语言可以让幼儿更加喜爱游戏;激发幼儿
近日,马化腾谈及企业级市场时表示:“中国的企业级市场将成为媲美互联网金融、跨境电商等少数细分行业的快速增长点。”与之相对应的,腾讯企,董官网隆重上线,一则时长30秒的TVC广
目的探讨连续性肾脏替代治疗(continuous renal replacement therapy,CRRT)非计划性下机时间的相关因素。方法采用目的抽样法,选取2013年12月至2014年5月在浙江大学附属第二