论文部分内容阅读
近年来,随着我国经济结构的转变,居民消费水平逐步提高,商业银行的各类消费信贷业务量激增,这使得银行的风险管控工作面临巨大的挑战。传统的风险评估方式主要依靠信贷人员的市场经验,风险评估结果受个人主观因素的影响较大,而且面对日渐增加的数据量和业务量,传统的评估方式效率低,业务周期长,准确率也难以保证。所以传统的评估方式已经不能满足当下商业银行信贷业务的发展,商业银行急需建立新型的评估精度较高的信用风险评估模型。本文以商业银行个人信贷业务的实际应用为背景,以汉堡大学捐赠的德国银行信用数据集为研究对象,对商业银行个人信用风险评估的模型进行了研究,主要工作如下:首先,对原始数据进行预处理,包括去除缺失值和离群点,变量特征合并,数据变换、数据标准化等,并利用处理后的数据进行描述性统计分析,构建简单的信用客户画像。其次,建立了三种单算法的个人信用评估模型,分别为Logistic回归模型、决策树模型和神经网络模型,并利用参数调整和引入代价矩阵的方式对单算法模型的性能进行优化。最终各模型预测结果显示,三种模型在测试集上的整体预测精度均在65%以上,预测效果较好。然后,为进一步提高模型的预测精度,在单算法模型的基础上,本文又建立了集成算法模型和组合优化模型。集成模型选择应用较为广泛的boosting集成模型和随机森林集成模型。与单算法模型相比,两种集成算法模型的预测精度均有明显的提升。另外,利用随机森林算法中各变量的平均精度降低(MDA)值的大小,对变量进行排序,选出了对模型结果影响较大的15个变量。组合优化模型是在神经网络单算法模型的基础上,针对该模型存在的稳定性较差的问题,利用遗传算法对其进行优化,并利用随机森林算法进行变量的筛选。经验证发现,组合优化模型对训练数据和测试数据的预测标准差均较小,模型的稳定性明显提升,同时模型对测试集的预测精度达到83.5%,预测效果最佳。最后,结合商业银行个人信用评估的实际应用背景,对所建立的六类模型进行对比分析。结果显示组合优化模型在模型预测精度、模型解释性和稳定性方面均有较好的表现,模型性能优于其它模型。因此,组合优化模型对商业银行建立自动化的信用评估体系具有一定的参考和应用价值。