基于工作流的数据挖掘过程管理的研究

来源 :第十九届全国数据库学术会议 | 被引量 : 0次 | 上传用户:wwwzhaozhiqiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是从数据中识别出有效的、新颖的、具有潜在效用的以及最终可理解的模式的高级过程.目前关于数据挖掘的研究很多,但大多数只着眼于挖掘算法,对于整个挖掘过程的研究也有一些,而对于如何管理挖掘过程的研究则很少.事实上,要成功地进行数据挖掘,算法只占据很小一部分.数据挖掘是一个需要多次反复的多阶段的复杂处理过程,如何合理地将各个处理阶段有机地结合在一起,如何有效地管理和控制各个阶段的协调进行,是能否成功完成数据挖掘的一个关键问题.为此我们引入工作流的概念来管理数据挖掘过程.本文首先简要介绍了工作流管理技术与数据挖掘过程,然后提出了基于工作流的数据挖掘管理系统的功能模块和体系结构,并介绍了该系统提供的主要服务。
其他文献
随着Internet的飞速发展,基于Web平台的各种应用受到了广泛的欢迎,基于Web平台的电子商务得到了空前的发展.对于一个电子商务网站来说,其拓扑结构蕴含了各个页面之间的关联关
网络上信息量的剧增,给网站的管理和用户的浏览带来一系列的难题.Web个性化技术,即Web站点根据用户的需求为其提供一对一的服务的技术,正是针对这些难题的解决应运而生的.目
会议
神经网络和遗传算法的结合是当前智能技术研究的重要内容,也是计算智能CI技术的重要组成部分。本文在分析BP算法和遗传算法机理之后,提出了一种遗传BP神经网络数据挖掘技术。由
关联规则是由Agrawal等人首先提出的一个重要的KDD研究课题,它反映了大量数据中项目集之间有趣的关联或相关联系.发现频繁项目集是关联规则挖掘应用中的关键技术和步骤.近年
会议
Internet的迅速发展,使其成为全球信息传递和共享的最重要资源,如何利用Internet上的大量信息成为亟待解决的问题.由于Internet上的数据多以半结构或无结构的形式出现,因此传
会议
目前,在数据仓库的数据清洗过程中,数据的不完全问题,并不受重视。现有的处理方法之一是直接去掉带缺失项的记录,这一方法虽然筒单,也使我们失去了许多有用的信息,甚至会使基于该数
会议
本文提出的算法EBNC一次处理整个数据集合的样本,因而速度比较快。这个算法基于Shannon信息理论,对于处理离散取值的属性有较高的准确性,同时保留了在引言中所述的Bayes网络的两
数据挖掘的优势在于它能从大量数据中提取人们感兴趣的、事先朱知的知识和规律。因此,基于数据挖掘的异常入侵检测方法可以不依赖于经验而检测出未知的攻击。但是,建立异常检测
会议
在国际金融外汇市场上,各个国家的金融机构或个人投资者通过对各国货币的买卖行为来获取投资利益.为了控制风险,交易员(或客户)要随时了解各种货币的汇率及其变化趋势的实时
会议
本文试图探索分类器在分类随时间推进的过程中面临的演变需求,该需求是外界的扰动对训练观念的改变弓陷的。本文从以下两方面进行了介绍:1.训练数据的属性特征选取需要变化。2.