数据挖掘中的数据预处理方法研究

来源 :全国第13届计算机辅助设计与图形学学术会议暨全国第16届计算机科学与技术应用学术会议 | 被引量 : 0次 | 上传用户:majing1619
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实世界中的数据库极容易受到噪音、数据缺少和数据不一致性的侵扰,因为数据库太大,常常多达数千兆,甚至更多.对数据进行预处理,可以提高数据质量,从而提高挖掘结果的质量.本文根据数据预处理在数据挖掘中的重要性,对数据预处理方法进行了研究,并给出几种数据预处理方法.
其他文献
本文介绍了NJφ1200(新型)氨合成系统工艺流程、三轴一径合成塔内件及其在化肥厂的应用.该系统具有生产能力大、氨净值高、系统阻力小、触媒层温度分布合理、能耗低等特点.
本文概述了A301型氨合成催化剂的技术特点及工艺特点;论述了轴径向氨合成塔配A301型催化剂的技术经济特点;介绍了A301型催化剂在轴径向合成塔上的工业应用.
该文介绍了多媒体系统中多功能控制卡的硬件设计、驱动和应用软件流程,该卡采用单片机技术控制多媒体系统中的工业电视视频信号切换、LED大屏幕驱动和其它子系统的工作状态,完成多
本文开发出了栲胶脱硫剂、该脱硫剂是在栲胶法脱硫基础上,将一级热溶橡碗栲胶进行充分氧化、降解,适当破胶,并添加适量化学物质,经干燥而成,省去了栲胶的制备工序和能源.
要加工含氨纶的弹力织物,首先要了解氨纶纤维的组成结构、弹性机理以及性能,其次要选择好坯布,特别是织物的幅宽、缩水、弹力等影响因素,同时要控制好染整加工中关键工序的工
本文阐述了叶面肥的施肥原理、特点、种类和发展趋势,认为叶面施肥是一种既经济又有效的施肥措施.在重视根部施肥的基础上,大力推广以腐植酸为主要成份的复合多功能绿色环保
随着科技的发展,越来越多的方面需要应用到湿度传感器.若能利用CMOS工艺将传感器部分、信号的处理电路等集成在同一块芯片上,从而进行大规模集成,就可以降低成本,减小整个系
提出了一种快速识别二维条码的方法.首先在周围有干扰的情况下提取条码区域并且算出条码的倾斜角度,即等间隔抽取扫描行进行梯度化和目标行二值化,进一步搜索特征点并做分类
本文对基于数据挖掘的数据质量分析研究进行了综述.首先介绍了数据质量的定义、分类和相关研究,然后具体分析了基于数据挖掘的数据质量分析的提出、研究现状、分析框架和步骤
文章论述了知识发现领域关联规则挖掘的现状,讨论了Apriori及FP增长等算法,并将它们基于格的结构作比较,指出基于扩展概念格挖掘关联规则的优越性.并且针对超大型数据库,分析