关联规则数据挖掘的研究及其在金融业的应用

来源 :云南大学 | 被引量 : 0次 | 上传用户:oslo123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库系统的广泛应用,在各个应用领域都存储了大量的数据,这些数据中包含了很多有用的信息,因此如何发现各种大型数据库中隐藏的、预先未知的信息,以辅助相关的应用显得尤其重要,这正是数据挖掘的任务.关联规则挖掘是数据挖掘的重要分支,其主要研究目的是发现数据属性间的规则,由于形式简单,易于理解,得到了广泛的研究和应用.在当前银行业激烈竞争的情况下,引入数据挖掘技术,使银行真正了解客户的行为和需求,对客户的价值做出客观地判断,对客户的信用风险加以预测,使银行为客户提供个性化的服务,在保留旧客户、发展新客户和市场营销方面占据主动.该文采用关联规则的经典算法Apriori算法对银行"个人信用贷款管理系统"中的客户数据进行了挖掘,并对其中出现的问题:不能挖掘小比例事件中的关联规则,提出了两种新的算法:基于概率分布的加权关联规则挖掘算法、基于概率分布的多支持度关联规则挖掘算法.并对算法作了详细的讨论.基于概率分布的加权关联规则挖掘算法,对每一个项目都设定了权值,它与该项目在数据集中出现的概率的倒数相关联,同时采用了改进的加权支持度计算方法,使能保持Apprior算法的频繁集向下封闭的特性,有效地提高了加权算法的运行效率.基于概率分布的多支持度关联规则挖掘算法,针对每个项目设定了最小项支持度,最小项支持度为该项的概率乘以支持度系数,由此,使发生概率较频繁的事件规则有较高的最小支持度限制,发生概率较低的事件则有较低的最小支持度限制.为了解决算法频繁集不封闭的问题,该文采用了将候选项集按照项目属性的最小项支持度排序的方法,尽可能多地完成剪枝,减少算法运行的开销.该文还对关联规则的有趣性,从客观和主观评价两方面进行了讨论,给出了基于兴趣度的评价方法、基于统计的X<2>度量的评价方法和基于规则模板的关联规则评价方法.
其他文献
要随着计算机和宽带网络技术日新月异的发展,以多媒体通信为主体的信息网络已成为世界关注的热点.尤其是因特网(Internet)的巨大成功,使IP成为未来信息网络的支柱技术,以IP为
该文所取得的主要成果和创造性工作如下:1.提出了基于二次熵的互信息QEMI特征选取的方法.特征选取是文本分类挖掘中的关键技术,是文本分类的基础.该文以广义信息论为理论基础,通
蜜罐(Honeypot)是近几年才发展起来的一种主动安全技术。它设置一个专门让黑客攻击的应用系统,以记录黑客的活动,便于我们了解黑客的攻击方式和手段,发现潜在的威胁。 论文对
多屏互动媒体中心是近年来兴起的一种多媒体应用软件。它具有一般媒体中心软件的媒体库管理和多媒体展示的功能,同时可通过局域网与其它多种媒体设备分享多媒体内容。本文基于
该文的第1章概述了自动文本分类技术的产生背景以及现实意义,给出了自动文本分类问题的描述和评估方法,并介绍了国外自动文本分类技术的发展状况,第2章综述了中文自动文本分
蚂蚁算法是一种的新的启发式算法,是目前国内外启发式算法研究的热点和前沿问题。它的应用已涉及许多领域,如旅行商问题、指派问题、job-shop调度问题、图着色问题等等,并且取得
该文针对基于内容的图像检索的主要方法进行了研究.在颜色匹配的研究中,采用不同的颜色空间和颜色特征,实现了多种基于颜色的图像检索算法,并且在建立的彩色图像数据库上对这
软件构件化是21世纪软件工业发展的大势趋,而工业化的软件复用方式已经从通用类库进化到了面向领域的应用框架.随着现在软件的复杂程度越来越高,也对应用开发框架提出了更多
该文根据行扫仪的使用需求和数字录放仪的技术特点,确定了录放仪的总体方案,包括:以嵌入式计算机为核心,以硬盘为磁记录介质,实时采集和存储图像数据,实时输出图像信号,对图
随着网络的不断发展,网络安全也越来越受到关注,传统网络安全模型已经越来越难以保障网络的安全,这其中包含很多原因,主要是由于传统的网络安全模型存在一个致命的弱点--试图