论文部分内容阅读
1999年,伴随着工商银行9991工程的落地,工商银行成为国内首家完成数据集中的银行。近些年来,随着银行信息化的发展,银行拥有了大量客户群,同时也伴随着海量的数据。截止2014年底,工商银行数据存储已经达到了1000TB。如何将这些集中的、海量数据变成有价值的信息成为工商银行最为关注的问题。因此,建设一个能够集风险管理、绩效管理、客户信息管理、综合统计报表的平台对工商银行具有很大的价值和意义。 在IT领域,数据挖掘依托动态商用数据库(目前业界最稳定的商用数据库是Teradata,最新的技术是开源Hadoop)用以存储数据,即在既定的前提和约束条件下,通过统计分析的方法,借助人工智能的手段,在海量的、不完整的结构化或非结构化数据中,萃取隐含在随机数据中有效信息,并以一定置信度面向特定领域进行预测,从而预测并解决问题。 数据挖掘能够按照期望的业务目标,对历史数据有层次的进行探析,发现数据中所蕴含的知识和规律。并可以根据用户需求,进将其模型值转换化为可以参考的有效指标,为工商银行经营管理活动、经营决策提供有效依据。 本论文以工商银行为研究对象,从理论的角度详细阐述了数据挖掘的理论、数据挖掘应用;介绍了企业级数据仓库系统及其建设;探索并论证了数据挖掘在工行的价值。研究了工商银行如何整合客户信息、挖掘客户信息及客户贡献度,并在最后绘画了工行数据挖掘新的蓝图,对未来研究做出了进一步的展望。