【摘 要】
:
在大数据环境下会不可避免的存在一些脏数据,严重的影响了数据质量,而数据清洗是提高数据质量的重要方法,对数据清洗框架的研究可以帮助大数据的系统决策。提出了一个大数据
论文部分内容阅读
在大数据环境下会不可避免的存在一些脏数据,严重的影响了数据质量,而数据清洗是提高数据质量的重要方法,对数据清洗框架的研究可以帮助大数据的系统决策。提出了一个大数据环境下数据清洗的一般框架,并对核心的数据清洗模块中的三个子模块进行详细的分析,包括不完整数据清洗子模块、不一致数据修复子模块和相似重复记录数据清洗子模块,且讨论了其清洗的具体流程。
其他文献
文章从分析疾病医学的局限性及面临的困境着眼,指出精准医学的意义不是基于疾病医学的精准,其核心是建立一个能个性化地描述人体状态并实现个性化调控的状态医学体系。而一直
目的:观察附子对两种不同慢性肾病模型小鼠乳酸代谢的影响,探讨附子的温阳、肾脏保护作用及与乳酸酸中毒的关系。方法:将雄性ICR小鼠随机分为7组:正常对照组、关木通模型组、
本文分析了高职数学课程教学改革的现状,总结了目前教学过程中存在的问题及原因,文中给出了教学模块与考核评价体系的构建原则,提出了模块化教学与考核评价的教学改革总体思
<正>紫花地丁(Herba Violae)为堇菜科(Violaceae)植物紫花地丁Viola yedoensis Makino的干燥全草,又名地丁草、独行虎、紫地丁,系早春开花的多年生草本。生于田间、荒地、山
时下媒体报道中经常可以见到许许多多令人生厌的文字与多少年大致不变的模式,媒体中的假报道、俗报道、艳报道、庸报道、恶报道等等屡见不鲜。这种缺少文化的感染力与渗透力
高职院校招生就业工作面临的新情况,对传统的工作理念形成了挑战。本文从高职院校招生就业工作理念创新的意义、内容和实现途径三方面进行了论述。提出了招生就业全员化、系
精准医学作为新兴的医学模式,强调了基因组学在临床疾病诊疗中的指导作用,将基础研究与临床应用相结合。本文通过论述精准医学和中医学关系,从中医证候诊断、治疗用药、预防
激励机制能使员工安心和积极工作。在组织的人力资源管理过程中,管理者应运用科学的理论和方法,按照不同人的不同需求采取相应的激励策略,对人的思想、心理和行为进行恰当的
<正>随着教育改革的进一步深化,学生的主体地位再一次被提到一个非常突显的位置,传统"保姆式"的班级管理模式已无法适应时代发展的需要。班集体生活中,对学生影响最大的已不
<正>浅议年鉴附录的功能定位及其内容选择蒋新甜在《中国地方志》2008年第1期上发表文章指出,所谓附录,是指依附于某一类文化作品的附件,即在编辑出版某一类文化作品时的随带