数据挖掘算法在个人信用评分模型中的应用

来源 :东南大学 | 被引量 : 1次 | 上传用户:sduheaven
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济社会的不断发展,激发了信贷消费的巨大发展,各种消费贷款迅速升温,国内各商业银行扩大了在信用消费方面的业务。由于历史原因,大部分商业银行都缺乏一套有效的个人信用评分方法,即使有也存在评估准确性差的缺点,从而对个人信贷消费的发展产生了不利影响。此外,对于商业银行来说,由于产品和服务的同质性,只有从大量的业务数据中掌握信息背后的规律,做出合理决策,才能在激烈的市场竞争中取胜。传统的信用评分体系如朴素贝叶斯算法,往往基于各自变量相互独立等一系列较为严格的假设,在面对海量且存在多重共线性的数据时,很难取得令人满意的效果。随着计算机技术和数据挖掘理论的快速发展,信用评分模型的方法得到了极大的丰富。数据挖掘技术由于对高维数据具有良好的拟合能力,因此近年来被广泛应用在金融领域。本文的研究目标是基于数据挖掘技术中应用最多的分类算法—决策树分类模型建立个人信用评分模型,并与Logistic回归建模的结果进行了对比。在完成了数据缺失值处理、样本抽取和基于卡方检验和互信息的变量选择等一系列的数据准备工作后,设置3:1的样本容量分别作为训练集和测试集,用这两种方法分别对其进行建模,并选用准确率、ROC、AUC等指标进行模型评估,得到通过决策树算法得到的信用评分模型效果优于Logistic回归模型的结论。
其他文献
中国科学技术信息研究所是科技部指定的科技期刊送交代收保存机构,是国家公益性科技文献信息服务机构,负责科技期刊的收录引证和引文统计分析工作。2010年11月,经过多项学术
冬春大棚蔬菜,极容易患猝倒病和立枯病两大病害。番茄、茄子、 辣椒、瓜类 等,在苗床期 和生长期患 病后都可造 成较缺苗或 幼苗成片死 亡。为保证大 棚蔬菜的早 熟和稳产、
深化理论研究发挥中介作用服务粮食行业曹文斌1996年10月15日同志们:湖南省粮食行业协会的成立和湖南省粮食经济科技学会的换届,是两件很有意义的事情。两会聘请我为名誉会长,今天又应邀
我国现代社会资源问题是最为关注的问题之一,非再生资源越来越严峻,该如何提高资源的有效利用率以降低资源消耗是各个国家都非常重视的问题。大量的研究表明,锅炉燃烧技术的引入
工程量清单计价是国际上通行的惯例,是比较科学和先进的一种计价模式,是使市场形成建筑产品价格的一种有效途径,是我国工程造价计价方法改革的一项具体措施,更是我国与国际惯例接
在我国,市场经济的迅猛发展,为社会科技的进步提供了良好的空间与平台,同时,相关部门与广大群众逐渐加大了降低电力资源消耗的重视力度,因此,我国大部分电力企业也领悟到了节
利用牛羊粪以及棕榈粕、花椒粕、蓖麻粕进行混合发酵(以下简称籽粕防治法),防治韭蛆,韭菜被害株率由14.8%-22.6%降为2.0%-3.4%,防治效果达84%以上,防效与毒死蜱灌根相同,但产量明显高于毒死蜱
【正】这是来自台湾的一家咖啡连锁店,用了3年时间,在台湾开了370家店,用1年时间,在马来西亚开了110家店。85度C正颠覆传统咖啡店。进一步壮大之后,85度C在台湾选择了上市之
西星红糯4号是以GN438-1-3为母本、华甜3189-222为父本杂交育成的甜糯型杂交种,具有口感好、品质优、出苗率高、综合抗性好等特点,2012年3月通过山东省农作物品种审定委员会
光伏产业作为半导体技术与新能源需求相结合而产生的可再生能源产业,是我国战略性新兴产业的重要发展方向。最近这些年,我国光伏产业的快速发展极大地推动着其他相关产业的发