论文部分内容阅读
在过去数十年间,由于信息技术的高速发展以及数据库技术的不断完善,无论政府部门、科研单位还是大型企业都积累大量的、以不同形式存储的数据。如何对大量数据进行有效的数据管理和数据挖掘成为目前数据库领域热门的话题。
本文针对中关村电子指数数据,进行了数据管理与挖掘的研究,主要进行了以下几个方面的工作:
1.依据规范的软件设计流程,按照需求分析、系统功能设计、数据库设计、数据管理流程设计、系统功能实现的顺序,通过使用ASENET技术和MVC设计模式,以SQL Server2008作为数据库,运用面向对象的软件设计方法,建立了完善的数据管理系统。通过在系统上对多个数据源的数据进行数据导入、产品匹配、导出报表等一整套数据管理操作,实现了对数据的规范化管理。
2.使用数据挖掘中的数据预处理、数据仓库构建、关联规则挖掘等技术,采用SQL Server2008的分析服务系统和微软数据挖掘语言(DMX)对“中关村电子产品价格-销售数据”进行数据建模,并通过不同维度,不同参数的关联规则挖掘,分析产品均价,涨幅,时间,以及品牌等因素对产品销售量的影响,给予管理者建议。并对关联规则挖掘可能产生的冗余情况进行了讨论和优化。