论文部分内容阅读
近年来,随着我国经济不断发展,居民收入水平持续提高,购买力越来越强,作为主要支付结算方式之一的载体的信用卡也得到了普遍的推广。与之伴随的是信用卡风险问题不断升级。对信用卡用户进行信用风险评估对银行降低风险、减小损失意义重大。本研究在回顾国内外目前对于信用卡风险评估的一些研究现状的基础上,分析了信用卡风险的概念和特点、信用卡风险的类型,并比较了个人信用风险评估常用的几种技术方法的优劣点。然后,针对信用卡申请时的信用风险评估问题,考虑到信用卡申请人递交的申请资料冗余属性多的特点,建立了基于随机森林的属性约简模型。又由于银行在实际处理信用卡申请的过程中,大多产生的是不平衡数据,本研究结合前人的一些数据处理方法,提出了对数据进行再平衡的SMOTE-UNDER方法,并在一些UCI数据集上进行了实验,实验结果表明,本研究提出的方法确实能有效处理不平衡数据的分类问题。在此基础上,本研究提出了基于GA-SVM的信用卡客户申请人信用风险评估模型。该模型利用遗传算法对SVM的两个重要参数进行优化,能有效提高预测精度。针对交易阶段的持卡人信用风险细分问题,本研究通过对一般常见的信用风险的类型及其在交易行为上的表现形式的分析,建立了基于持卡人交易行为的客户信用风险水平细分指标体系。由于客户细分多采用聚类的方式进行,本研究结合几种传统的聚类算法的优缺点,提出了一种改进的客观聚类分析算法(Improved-OCA)。该算法以客观聚类分析算法(OCA)为基础,利用该算法确定聚类数目,利用K-means聚类算法对样本量和数据分布无要求、除聚类数目外不需要任何输入参数、简单易行的特点,将它作为基层执行算法,同时引入基于密度的聚类方法的思想,在每个类中设置多个聚类中心点,使其可以聚成各种形状的类,不受K-means聚类算法倾向于球形聚类的限制。利用该方法对持卡人交易行为进行聚类,将持卡人自然分为了3类。分析各类的特征,将持卡人标记为低信用风险类、中信用风险类和高信用风险类,以便银行可以对不同群体的客户采取不同的防范措施,减小风险。针对持卡人还款过程中常出现的逾期还款现象,提出了基于BP神经网络的逾期还款信用风险两阶段评估模型。现有的关于逾期还款风险评估的研究大多集中在对持卡人是否会逾期还款进行评估。但逾期还款不等于坏账,只有逾期超过一定期限的客户才是真正的“坏客户”。因此,本研究在第一阶段对持卡人是否会逾期还款进行分类的基础上,又在第二阶段对持卡人逾期时间进行了预测。考虑到单个BP神经网络模型运行结果受初始权值影响大,稳定性不好,本研究以Adaboost方法训练若干个弱分类器和弱预测器,结合成一个强分类器和一个强预测器,完成了第一阶段对客户是否会逾期还款的评估,以及第二阶段对客户逾期时间的预测。最后用该方法对某银行的持卡人还款情况进行了数值实验,结果显示本研究提出的逾期还款信用风险两阶段评估模型具有很高的预测精度。