基于工作流的数据挖掘过程研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:wml889900
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面对现今越来越多的数据源和越来越大的数据量,数据挖掘能够有效地从这些海量数据中获取有价值的信息可以使人们更好地预测未来可能出现的数据信息,从而提高工作效率。然而国内尚未有基于工作流的实用数据挖掘算法库、企业数据管理仓库工具库、企业知识库管理工具库的文献报道,关于这方面的研究和工作自然成为了当前的一个新兴热点。 传统的应用程序面向的事务处理是以需求分析为基础的开发软件,而需求是相对确定的、固定的;数据挖掘的应用程序面向的决策支持在各个阶段有不同的任务模块,其需求是易变的、流动的。对于反复调试的模型,后者显得更加适用。实际上,数据挖掘的应用程序是适合工作流这种新型开发模式的,现今,S-plus和Sas中已经有基于工作流的集成环境应用于数据挖掘,但成本及维护费用过高,所以用户只限于大中型企业;相对来说,以SQL Sever的DTS作为工作流引擎的数据挖掘却拥有成本低廉的特点,能够满足小型企业的需要,填补了实际情况中基于工作流的数据挖掘应用的一些市场空白。 本文将工作流的形式应用于数据挖掘的算法流程当中,将常用数据挖掘算法、数据仓库与知识库管理和维护算法的通用结构的模块化,建成基于工作流引擎的算法库和工具库。在实际应用中,对于时常有新数据更新的数据挖掘任务(如企业数据管理、证券股市等)更加适用,达到了提高效率、减少耗费、优化流程以及增强可管理性等效果。 本论文致力于集成方案的研究,实现了将SQL Sever中的DTS作为工作流引擎进行数据挖掘,实现了将工作流技术与数据挖掘技术相结合。在介绍理论基础的同时对实际情况进行了举例论证,针对一些真实的数据进行实验,最终确定了研究的实用性和可行性。并且,使用了模式行集提取规则的方法,更加有利于模型成果的发布。得以验证以后,再将此类研究工作的成果大量运用于社会经济运作中,取得良好的实际效益,达到研究工作的最终目的。
其他文献
The innovation of organizational model of tobacco production is the key to realization of sustainable development of tobacco production in China. From the persp
随着Internet的发展,各类信息,如文本、图像、声音、视频、3D模型等,在网络上的交换和传输更加便捷与此同时,也出现了有意或无意地复制、修改和传播等侵权行为数字水印技术作为一
期刊
期刊
IPSec是为Internet通信提供安全服务的一组标准协议。其目标是为IPv4和IPv6提供具有较强互操作能力、高质量和基于密码的安全服务。Linux作为著名的开放源代码操作系统软件,对
采用田间试验方法,研究了杂交中稻广两优272的营养特性与施肥效应。结果表明,在生育前期氮、磷需求量大,中后期钾素吸收量增加;对广两优272产量构成因子的影响大小依次为N、K
数字签名是密码学的重要组成部分,是信息完整性、真实性的理论基础,在网络中的密钥分配、安全电子交易等方面都有重要应用。随着网络的普及化,电子商务的发展,网络安全变得越来越
期刊
期刊
大量事实证明,小波主要适用于表示具有各向同性奇异性的对象,对于各向异性的奇异性,如数字图像中的边界以及线状特征等,小波并不是一个很好的表示工具。这也正是基于小波的一系列