面向大学生健康领域的数据挖掘技术研究

来源 :教育教学论坛 | 被引量 : 0次 | 上传用户:xchjzl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:为了配合学生素质教育改革,教育信息管理必须变换原有的手工处理方式。利用计算机自动实现数据筛选、自动阅读数据信息,势在必行。这必将大大提高辅导员的工作效率,能有效地提高对大学生综合管理水平。长期以来,学生综合素质评价报告一方面被辅导员们重视力度不够,另一方面被辅导员所带学生较多致使评语千篇一律,文式枯燥。面对海量数据如何客观分析说明,在这种情况下人们就迫切需要一种能去粗存精、去伪存真,快速、精炼得到相应结论的技术。数据挖掘是目前人工智能和数据库领域研究的热点问题,是一种决策支持过程[1]。它主要是基于人工智能、模式识别、数据库、可视化编程技术等,高效快速地分析数据,做出合理准确地归纳推理,是教育发展趋势。
  关键词:数据挖掘;人工智能;精炼
  中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2015)33-0229-02
  一、数据挖掘在国内外概况
  数据挖掘是指从数据库的大量数据中寻找出隐含的、先前未知的并有潜在价值信息的非平凡过程[2]。目前国外的数据挖掘主要是基于对发现知识方法的进一步探索,如近年来的Bayes(贝叶斯)方法和Boosting方法。国内数据挖掘技术还不完善,从事这方面科研的人员也多数集中在高校,主要研究的是一些理论数据挖掘算法,能真正把科学理论转化为现实成果的还是少之又少,目前市场上所拥有的产品比较单一不够全面,在一线工作的人员迫切需要一种能够从多种混合信息中自动提取出有用价值的技术,来缓解他们的工作压力。
  二、主要创新点、技术关键
  1.数据挖掘语言的规范化,标准的系统开发化,模板数据的统一化,提高数据接口和系统功能之间的相互操作能力,促进其在社会企业的方方面面都能够得到广泛应用。
  2.寻求一种简单、有效的可视化编程方法,使数据的可视化程度真正起到能够推动改变人们主观能动性作用。
  3.与实际企业应用的一些特殊数据类型的兼容问题,依据不一样的数据存储容貌特征,切实采用一些行之有效的研究开发方法不仅是现在而且也是将来都必须要面对的事实问题。
  三、建立起切实可行的数学模型
  1.确定评价参数要求的模糊构架M={mj,m2,m3,m4…mn)。其中mj,j=l,2,3,4…,n是评估参数要求个数,n是同一层次上的参数的个数,这一集合初步构建起评估要求的数学模型框架。
  2.确定评价结果的模糊构架N={ni,n2,n3,n4…ni}。其中ni,i=l,2,3…,i是评估参数要求个数,n是同一层次上的参数的个数,通过比较也就是要得到的等级档次数。这一数学模型规定了结果的参数既可以是定性的理论文字说明,也可以是量化的具体分数。
  3.确定隶属度函数。假设需要对第j个评估参数mj要进行量化标准说明,首先要得到一个相对于Nj的模糊函数Rj=(rij,r12,r23…,rmn),其中i=l,2,3…n;j=l,2,3…m,rij为参数Mj具有Ni的程度,如果对n个元素进行整体说明,其结论就组成了一个m行n列的矩阵,称之为隶属函数度的值R。通过上述说明很明显可以得到该矩阵中行就是对每一个单评估参数的评价结论,同时整个矩阵也就包含了对所有评估参数所必须要获得的全部信息。
  4.确定权重向量。权重向量又称权向量,权系数ωi的大小代表相应目标fi在多目标中的重要程度。在刚才确定好的m行n列矩阵中现要算出每行的和ai以及矩阵中所有元素的和a,最后权重向量ωi=ai/a。
  5、得到最终结果B。权重向量ωi与隶属函数度的值R按照某种特定算法的组合就可以得到该事物的最终评价结果:B=ωi*R(*为算子符号)。
  四、学生素质评测系的实现
  (一)学生素质评测功能
  学生素质评测子系统是整个系统数据的主要入口,该子系统主要实现的问题是通过工作人员记录学生平时的日常生活管理、课外活动表现、在校学习状况等事件产生出相应的量化分数或是等级程度。然后将这些内容分类与归纳录入到计算机中,在评价时把这些记录通过计算机系统进行调用处理,与事先规定好的体系标准进行比较。采用推优选优制度,是当前绝大多数学校进行德、智、体三方面的综合测评标准的主要依据。一般学校的测评计算公式为:M=0.2M1 0.7M2 0.1M3,其中M代表测评总分,M1、M2、M3分别为德育成绩、智育成绩和体育成绩,各系数为三者权衡比重,从上述公式也不难发现各个学校对学生的要求基本都是“以学习为主,德智体全面发展为辅”的办学宗旨。
  评测子系统的功能分由两部分组成,一部分描述的是基本信息如学生基本信息,学籍管理信息等,另一部分描述的是素质评测管理信息如测评成绩管理、日常表现管理、素质等级管理、历史记录管理等。其中日常表现管理又分为课外活动管理、道德行为管理、考勤管理、学生身体状况和特殊事件管理。
  1.学生基本信息模块。
  目标:学生档案的添加、删除、修改、查询和打印
  用户:学生、班评审小组、班主任、辅导员、学生处领导
  功能:添加、删除、修改和查询学生的基本资料,根据不同的用户对于添加、修改和删除功能需要设置不同的权限。
  2.学生的评测模块。
  目标:管理学生的测试成绩
  用户:学生、班评审小组、班主任
  功能:学生素质测评成绩的动态添加、删除和修改。
  (二)数据库程序的规范设计
  数据挖掘是在数据库和数据仓库的支持下进行高率合理的提炼和知识挖掘工作的,因此我们构建的学生信息数据仓库,在建立时就特别需要注意数据的可靠性。表中应该尽量避免使用可为空的列,其次表中的记录应该有一个唯一的标识符,最后数据库在使用的时候要有统一的前缀名。所以数据库系统的建立一定要考虑实际需求和功能划分,设计出行之有效的数据库,使其一定要固有可靠、使用可靠和环境适应可靠。   五、系统开发工具及代码实现
  该系统的前台开发是基于Visua1 Basic 6.0语言,以SQL Server 2000作为后台数据支撑,考虑数据的安全性,采用C/S的结构模式。部分代码如下:
  Sql = "Select * From 用户信息表 where 用户名=’"
其他文献
数据集成是实现数据共享的有效手段,目前实现数据集成的主要方法有数据仓库等,而在这些方法中都存在数据使用的耦合问题,文章对此进行研究,通过对SDO的概念阐述以及对高校数
测绘与国土资源管理就是服务与被服务、保障与被保障的关系,因此,把测绘与国土管理紧密结合,才能更好的发挥测绘的作用。本文提出利用GIS技术的空间信息管理、存储、表达、分析功能,高效地对各类测绘成果进行管理、维护和更新,并发挥GIS技术的专题制图功能,根据用户需要生成各种分析图件,便于土地系统的各种业务应用。论文基于Arc GIS平台,利用AE组件GIS模块,采用VS.net开发环境下的C#开发语言,
分析虚拟企业项目的特点;针对参与虚拟项目的企业既合作又独立的特点,提出项目自治域的概念,并给出基于自治域的虚拟企业项目管理系统的模型;针对虚拟项目的计划、资源集成、资源
文章详细介绍了传统的日程管理系统所遇到的问题,针对传统日程管理系统日程提醒不及时、不便捷的缺陷,研究基于Android和Android Wear的日程手表的设计与实现。阐述了设计日
工业生态协同是基于生态共生理念和前提,借助协同学方法论,对工业企业自身及企业及企业之间的生产及经营方式进行系统研究,促使其实现资源生态合理性优化配置的企业运作方式
论述了粗苯洗油的质量要求,分析了粗苯洗油变坏的原因,指出了处理变坏洗油的办法。
随着科技的不断进步和发展,现代的发控系统趋于复杂化和软件化,软件质量对发动机的性能和可靠性产生决定性的影响,因此,着眼于提高测试效率和质量必须选取合适的软件测试模型
本文首先从农产品流通渠道的角度把突发事件分成三类,即农产品产地突发事件、农产品运输突发事件和农产品市场突发事件,然后分别对每类突发事件中对农产品价格的影响进行分析
目的:探讨研究一贯煎加减治疗胃阴亏虚型慢性胃炎的疗效。方法:随机选取2018年6月—2019年12月在本院确诊为胃阴亏虚型慢性胃炎的患者100例,按照随机数字表的方法将患者分为