数据挖掘技术在商业银行个人信用风险评估中的应用

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:lwangkun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着我国经济结构的转变,居民消费水平逐步提高,商业银行的各类消费信贷业务量激增,这使得银行的风险管控工作面临巨大的挑战。传统的风险评估方式主要依靠信贷人员的市场经验,风险评估结果受个人主观因素的影响较大,而且面对日渐增加的数据量和业务量,传统的评估方式效率低,业务周期长,准确率也难以保证。所以传统的评估方式已经不能满足当下商业银行信贷业务的发展,商业银行急需建立新型的评估精度较高的信用风险评估模型。本文以商业银行个人信贷业务的实际应用为背景,以汉堡大学捐赠的德国银行信用数据集为研究对象,对商业银行个人信用风险评估的模型进行了研究,主要工作如下:首先,对原始数据进行预处理,包括去除缺失值和离群点,变量特征合并,数据变换、数据标准化等,并利用处理后的数据进行描述性统计分析,构建简单的信用客户画像。其次,建立了三种单算法的个人信用评估模型,分别为Logistic回归模型、决策树模型和神经网络模型,并利用参数调整和引入代价矩阵的方式对单算法模型的性能进行优化。最终各模型预测结果显示,三种模型在测试集上的整体预测精度均在65%以上,预测效果较好。然后,为进一步提高模型的预测精度,在单算法模型的基础上,本文又建立了集成算法模型和组合优化模型。集成模型选择应用较为广泛的boosting集成模型和随机森林集成模型。与单算法模型相比,两种集成算法模型的预测精度均有明显的提升。另外,利用随机森林算法中各变量的平均精度降低(MDA)值的大小,对变量进行排序,选出了对模型结果影响较大的15个变量。组合优化模型是在神经网络单算法模型的基础上,针对该模型存在的稳定性较差的问题,利用遗传算法对其进行优化,并利用随机森林算法进行变量的筛选。经验证发现,组合优化模型对训练数据和测试数据的预测标准差均较小,模型的稳定性明显提升,同时模型对测试集的预测精度达到83.5%,预测效果最佳。最后,结合商业银行个人信用评估的实际应用背景,对所建立的六类模型进行对比分析。结果显示组合优化模型在模型预测精度、模型解释性和稳定性方面均有较好的表现,模型性能优于其它模型。因此,组合优化模型对商业银行建立自动化的信用评估体系具有一定的参考和应用价值。
其他文献
本文针对地方高校职称评聘工作中存在的突出问题,对吉林省属高校正在实行的职称“评聘结合”改革进行了深入分析,阐述了“评聘结合”改革的本真意义。
借助丹尼森方法 ,对福建的区域工业增长进行了要素分解与分析。从要素的贡献水平及其变动中得出了一个大体的评价 :即福建工业正处于从依靠增加投入、数量扩张的粗放式增长向
本文提出了一种用神经网络来实现模糊系统建模的神经模糊网络,并将其用于建立预测模型,同时网络采取动态的网络结构和参数以适应预测对象环境变化和结构变化。实例分析证实了该
通过对石川河流域整治后的土壤养分及水质进行调查,采土样室内试验后发现富平石川河地区土壤养分中,速效钾和有效磷含量均高,有机质含量极低,全氮含量较低,并分析产生这些差
在开展创文攻坚、乡村振兴等中心工作中,肇庆市高要区注重发挥组织带动、党员先行的作用,把党组织建在工作一线。  锣鼓声声中,2018年12月29日,位于广东省肇庆市高要区的广茂铁路新桥道口立交正式通车,该工程竣工通车彻底实现了广茂铁路交通和省道273线公路交通分流,新桥镇及周边10多万群众“等火车,过马路”的日子一去不复返。广东省人大代表、高要党员先锋模范夏冠新连续三年在省人大议案中提到广茂铁路新桥
情感投入是国家向其他国家、组织或个人投入积极情感的官方行为,是当代中国外交实践中广泛出现的经验现象,但尚未得到充分的学理关注。针对诸多周边中小国家,中国通过关系定
本文介绍了半参数部分线性模型及其结果,并用之对农历季节因子对我国财政预算收入和社会商品零售总额的影响进行了分析预测更多还原
随着党中央国务院于2018年11月正式批准《上海市机构改革方案》,标志着全国31个省份的省级机构改革方案已全部获中央批复同意。  根据中共中央2018年3月印发的《深化党和国家机构改革方案》,“省级党政机构改革方案要在2018年9月底前报党中央审批,在2018年年底前机构调整基本到位。省以下党政机构改革,由省级党委统一领导,在2018年年底前报党中央备案。所有地方机构改革任务在2019年3月底前基
研究了一品红红色素的提取条件及其稳定性.