数据挖掘技术在企业决策系统中的应用研究

来源 :计算机光盘软件与应用 | 被引量 : 0次 | 上传用户:wuzhihot9
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:本文首先讨论了数据挖掘技术,给出了一种企业决策系统。并就决策系统的构成、流程和采用的数据挖掘技术进行了探讨。
  关键词:数据挖掘;数据仓库;企业决策系统
  中图分类号:N37 文献标识码:A文章编号:1007-9599 (2010) 04-0000-01
  Research of Data Mining Technology in Business Decision-making System
  Shi Dongsheng
  (Inner Mongolia University,Information&Engineering Technology College,Inner Mongolia,Baotou014010,China)
  Abstract:This paper discusses data mining technology,presents a business decision system.Decision-making system on composition, process and use of data mining techniques are discussed.
  Keywords:Data mining;Data warehouse;Business decision-making system
  随着计算机管理信息系统的飞速发展和广泛应用,企业生产经营的自动化水平不断提高,大大提高了工作效率。但企业业务系统运行所产生的大量原始数据是企业生产经营活动的真实记录,不能为本企业加以有效的统计、分析及评估,无法将这些数据转换成企业有用的信息、为企业战略决策提供参考和支持。数据挖掘正是在这样的应用需求环境下产生并迅速发展起来的,它的出现为智能地把海量数据转化为有用的信息和知识提供了新的思路和手段,设计开发基于数据挖掘的企业决策系统是合理解决这一问题,提升企业综合竞争力的最佳对策。
  一、数据挖掘技术
  数据挖掘,是指从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们不知道的、但又是潜在有用的信息和知识的过程。它是数据库研究中的一个新领域,融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术,把人们对数据的应用从低层次的查询,提升到从数据中挖掘知识,提供决策支持的层级。
  数据挖掘一般由数据准备、挖掘操作、结果表达和解释三个主要阶段组成。在数据准备阶段应集成多个运作数据源中的数据,解决语义模糊性、处理遗漏数据、清洗脏数据。挖掘阶段是一个假设产生、合成、修正和验证传播的过程,也是上述三个阶段的核心。结果表达和解释阶段根据最终用户的决策目的把提取的有用信息正确地表达出来。
  数据挖掘的方法和技术可大致划分为三类:统计分析、知识发现、可视化技术等。统计分析用于检查异常形式的数据,然后利用统计模型和数学模型来解释这些数据,统计分析方法是目前最成熟的数据挖掘工具。而知识发现则着眼于发现大量数据记录中潜在的有用信息或新的知识,属于所谓“发现驱动”的数据挖掘技术途经。知识发现常用的方法有人工神经网络、决策树、遗传算法、模糊计算或模糊推理等。数据质量、可视化数据的能力、极大数据库尺寸、数据挖掘者的技能、数据的粒度都是影响知识发现方法的重要因素。可视化技术则采用直观的图形方式将信息模式、数据的关联或趋势呈现给决策者,决策者可以通过可视化技术交互式地分析数据关系。
  二、基于数据挖掘的企业决策系统
  数据挖掘面对的是经初步加工的数据,使得数据挖掘更专注于知识的发现;而数据仓库用于完成数据的收集、集成、存储、管理等工作,两者必须有机结合起来使用。
  基于数据挖掘的企业决策系统主要由数据库、数据仓库、数据仓库管理模块、知识库、知识发现模块、数据挖掘工具、人机交互模块构成(如下图所示)。系统的输入主要源于经过初步处理的数据库数据以及存储在知识库中的历史知识和经验;数据仓库管理模块用于数据仓库的建立以及数据的筛选操作;知识发现模块控制并管理知识发现过程,它将数据的输入和知识库中的信息用于驱动数据选择过程、知识发现引擎过程和发现的评价过程;人机交互模块通过自然语言处理和语义查询在用户和系统之间提供相互联系的集成界面。数据挖掘工具用于完成实际决策问题所需的各种查询检索工具、多维数据的联机分析分析工具等,以实现决策支持系统的各种要求。
  数据挖掘主要提供了以下几种模式:
  (一)分类模式:根据数据的值从树根开始搜索,沿着数据满足的分支往上走,直到树叶确定类别。
  (二)回归模式:回归模式与分类模式相似,区别在于分类模式的预测值是离散的,而回归模式的预测值是连续的。
  (三)时间序列模式:根据数据随时间变化的趋势预测将来的值。只有充分考虑时间因素,利用现有数据随时间变化的一系列的值,才能更好地预测将来的值。
  (四)聚类模式:把数据划分到不同的组,组之间的差别尽可能大,组内的差别尽可能小,进行聚类前并不知道将要划分成几个组和什么样的组。
  (五)关联模式:利用数据项之间的关联规则。
  (刘)和概念描述和比较操作:把具有共同性的数据做汇总操作,从而得到一个具有一般性的规则描述。
  在实际应用中,可以根据具体情况采用不同模式组合,达到最优化的数据挖掘方式。
  在用户使用该系统时,首先需要通过分析决策需求,描述和表示决策的问题,确定数据来源,即可建立数据仓库;其次针对所要发现的任务的所属类别,设计或选择上述有效的数据挖掘算法并加以实现,从平凡的历史数据中提出综合数据,独立存储为库文件,作为更高一层数据挖掘对象;同时测试以评价所发现的知识,对知识进行一致性、效用性处理。最后根据最终用户的要求,建立适用于决策支持的数据仓库的集成界面和应用程序,使用户能在决策支持中运用所发现的知识。对于该系统的执行,每个步骤包含了循环和反复,可以对发现的知识不断求精、深化,并使其易于理解。
  三、结论
  总之,数据挖掘技术可以使其应用者由原来通过定期的、固定的报表进行定性的分析而上升到实时的、动态的各种形式的图表进行定量的分析,从而可以敏感地发现市场的微小变化并迅速做出反应,为企业在激烈的市场竞争中立于不败之地提供了强有力的工具。
  参考文献:
  [1]范明,孟小峰.anjiawei,etal.数据挖掘:概念与技术[M].北京:机械工业出版社,2007
  [2]李捷.基于数据仓库和数据挖掘的企业决策支持系统研究[J].科技经济市场,2006,7
  [3]范丽霞,张雪兰.利用数据仓库和数据挖掘实现电信决策支持系统[J].计算机与现代化,2005,8
其他文献
该文结合实际教学中的体会,提出将Robocode机器人游戏编程融入到Java教学活动中以便提高该课程的实际教学质量及学生的实践能力。
华法林是临床上广泛使用的口服抗凝药物,其治疗范围窄,个体差异大,尤其在治疗初期,易导致严重的出血并发症,如何合理、安全使用成为国内外研究者关注的重点和难点。华法林的
目的探究重组人脑钠肽(rhBNP)对扩张型心肌病及心肌梗死所致急性心力衰竭的治疗效果。方法选取2007年4月至2011年8月兰州军区乌鲁木齐总医院收治的扩张型心肌病及心肌梗死致急
信息化在中国经历数十年的发展,各企事业单位已经拥有了不同种类的成熟的基础信息系统,这些系统称为联机业务系统,如今根据自身发展的迫切需要,企业已经进入了商业智能(BI)分析的信
医院计算机网络信息资源在社会发展中正日益占据主导地位,只有对医院计算机网络信息资源进行有效的管理,才能将网络信息环境变为有序的信息空间,实现信息资源效用最大化,发挥它的
随着全球经济的飞速发展、人口老龄化及生活方式的改变,糖尿病的患病率也在迅速增加。目前,糖尿病的各种急性和慢性并发症已得到广泛关注,糖尿病与骨质疏松的关系也越来越引
本设计基于AT89S51单片机及DSl8 B20温度传感器设计高精度温度计,并采用Proteus软件及Keil51软件进行仿真实验,达到3路温度显示的结果。本设计,通用性好,功能强,重量轻,耗能低,可靠
主要论述当前建筑施工企业安全生产管理中存在的问题及其防治措施,施工企业实施安全管理目标责任制过程中存在的问题及其防治措施,施工企业安全管理人员队伍存在的问题及其防治
随着我国经济快速发展,社会保险制度也得到有效完善,但很多企业在社会保险方面仍然存在很多不足之处,严重制约着社会保险工作的顺利开展。本文就新时期国有企业社会保险工作
摘要:随着互联网用户的快速发展和成熟,婚恋交友网站已在全世界广泛流行,“网络红娘”的出现对传统交友方式和恋爱观念形成了强烈冲击,并形成了一项具有很好发展前景的新兴产业。在线征婚已成为目前很多年轻人征婚的新途径。  关键词:婚恋交友;功能模块;模型  中图分类号:TP311.52 文献标识码:A 文章编号:1007-9599 (2011) 21-0000-01  Network Love and