论文部分内容阅读
随着经济的发展,中国信用卡的使用逐渐得到普及,信用卡的交易规模也逐年上涨。伴随消费驱动力增强及金融管理新政推进,信用卡业务增长强劲,规模持续增长,成为各银行竞争的战场。但与此同时,信用卡的欺诈案件也呈上升趋势,在近三年金融诈骗案件总量中占比约78%。当前各银行的反欺诈系统,主要采用专家规则的方式,利用业务专家的经验总结过去欺诈案件的特征,制定相应规则,当信用卡交易满足一定规则时,被认为是欺诈交易。但是这种方式过于依靠专家的经验,规则更新较慢,无法应对层出不穷的欺诈事件。目前国内外银行逐渐将数据挖掘模型用于反欺诈系统中,而这些模型大多采用有监督学习方法,但是在现实中,绝大部分交易未在事前被标记为欺诈交易,因此存在严重的数据失衡问题,信用卡欺诈数据很难适用传统的分类模型。而异常检测模型可以直接识别异常交易,对数据失衡问题不敏感,因此在信用卡反欺诈应用领域受到关注。
本文以S银行为研究对象,分析了该银行信用卡反欺诈的现状以及存在的问题,为了优化该银行的信用卡反欺诈体系,本文基于OneClassSVM模型以及模拟退火算法设计了信用卡反欺诈模型,并在S银行的数据上进行了实证,验证了该模型的有效性。
本文的结论如下:(1)S银行目前信用卡反欺诈体系存在欺诈风险管理理念落后、反欺诈风险管理体系有所缺失,反欺诈风险系统及工具落后等问题;(2)本文设计了资产及负债、信用卡交易、商户信息、客户业务及其他情况等四个维度23个指标用于刻画用户信用卡交易行为。其中商户信息类指标是本文的创新指标,在实证中,当移除商户信息后,模型的负样本准确率下滑了7.8%,正样本准确率下降了0.72%,说明商户信息对于信用卡反欺诈判断具有一定的意义,验证了本文设计该类指标的有效性,丰富了当前反欺诈中的指标体系;(3)本文基于OneClassSVM模型构建信用卡反欺诈模型,
首先收集相关数据作为样本,并将样本拆分为训练样本以及测试样本。其中训练样本用于模型学习,求取各类参数,测试样本用于测试模型在样本外的效果;其次,使用训练样本对OneClassSVM进行建模,并采用模拟退火法求得最优参数,得到最终的模型;最后,使用测试样本作为输入,利用训练后得到的OneClassSVM进行预测;(4)本文对相关模型进行了实证分析,在测试集上,OneClassSVM模型的正样本准确率为95.2%,负样本准确率为92.6%;高斯分布模型的正样本准确率为93.9%,负样本准确率为63.4%;未平衡样本的SVM模型的正样本准确率为99.99%,但是负样本准确率为0;平衡样本后的SVM模型正样本准确率为94.9%,负样本准确率为65.1%;通过专家规则进行判断的正样本准确率为94.8%,负样本准确率为52%。其中正样本是指正常交易的样本,负样本是指存在欺诈行为的样本。可以看到,未平衡样本的SVM模型虽然对于正样本的准确率最高,达到99.99%,但是该模型无法识别欺诈样本,负样本准确率为0,失去了预测的意义。OneClassSVM模型对于负样本具有最高的预测准确率,比当前的专家规则方法提高了40.6个百分点,而在正样本的预测上提高了0.4个百分点。对比当前在异常检测中使用较多的高斯分布模型,OneClassSVM模型在负样本的预测准确率上提高了39.2个百分点,正样本上提高了1.3个百分点,对比平衡样本后的SVM模型,OneClassSVM在负样本预测准确率上提高了27.5个百分点,正样本上提高了1.4个百分点,因此说明了OneClassSVM模型的有效性。首先收集相关数据作为样本,并将样本拆分为训练样本以及测试样本。其中训练样本用于模型学习,求取各类参数,测试样本用于测试模型在样本外的效果;其次,使用训练样本对OneClassSVM进行建模,并采用模拟退火法求得最优参数,得到最终的模型;最后,使用测试样本作为输入,利用训练后得到的OneClassSVM进行预测;(4)本文对相关模型进行了实证分析,在测试集上,OneClassSVM模型的正样本准确率为95.2%,负样本准确率为92.6%;高斯分布模型的正样本准确率为93.9%,负样本准确率为63.4%;未平衡样本的SVM模型的正样本准确率为99.99%,但是负样本准确率为0;平衡样本后的SVM模型正样本准确率为94.9%,负样本准确率为65.1%;通过专家规则进行判断的正样本准确率为94.8%,负样本准确率为52%。其中正样本是指正常交易的样本,负样本是指存在欺诈行为的样本。可以看到,未平衡样本的SVM模型虽然对于正样本的准确率最高,达到99.99%,但是该模型无法识别欺诈样本,负样本准确率为0,失去了预测的意义。OneClassSVM模型对于负样本具有最高的预测准确率,比当前的专家规则方法提高了40.6个百分点,而在正样本的预测上提高了0.4个百分点。对比当前在异常检测中使用较多的高斯分布模型,OneClassSVM模型在负样本的预测准确率上提高了39.2个百分点,正样本上提高了1.3个百分点,对比平衡样本后的SVM模型,OneClassSVM在负样本预测准确率上提高了27.5个百分点,正样本上提高了1.4个百分点,因此说明了OneClassSVM模型的有效性。
本文的研究对于提升S银行信用卡反欺诈能力具有重要的现实意义,也对将异常检测模型应用在银行信用卡反欺诈领域提供了参考。
本文以S银行为研究对象,分析了该银行信用卡反欺诈的现状以及存在的问题,为了优化该银行的信用卡反欺诈体系,本文基于OneClassSVM模型以及模拟退火算法设计了信用卡反欺诈模型,并在S银行的数据上进行了实证,验证了该模型的有效性。
本文的结论如下:(1)S银行目前信用卡反欺诈体系存在欺诈风险管理理念落后、反欺诈风险管理体系有所缺失,反欺诈风险系统及工具落后等问题;(2)本文设计了资产及负债、信用卡交易、商户信息、客户业务及其他情况等四个维度23个指标用于刻画用户信用卡交易行为。其中商户信息类指标是本文的创新指标,在实证中,当移除商户信息后,模型的负样本准确率下滑了7.8%,正样本准确率下降了0.72%,说明商户信息对于信用卡反欺诈判断具有一定的意义,验证了本文设计该类指标的有效性,丰富了当前反欺诈中的指标体系;(3)本文基于OneClassSVM模型构建信用卡反欺诈模型,
首先收集相关数据作为样本,并将样本拆分为训练样本以及测试样本。其中训练样本用于模型学习,求取各类参数,测试样本用于测试模型在样本外的效果;其次,使用训练样本对OneClassSVM进行建模,并采用模拟退火法求得最优参数,得到最终的模型;最后,使用测试样本作为输入,利用训练后得到的OneClassSVM进行预测;(4)本文对相关模型进行了实证分析,在测试集上,OneClassSVM模型的正样本准确率为95.2%,负样本准确率为92.6%;高斯分布模型的正样本准确率为93.9%,负样本准确率为63.4%;未平衡样本的SVM模型的正样本准确率为99.99%,但是负样本准确率为0;平衡样本后的SVM模型正样本准确率为94.9%,负样本准确率为65.1%;通过专家规则进行判断的正样本准确率为94.8%,负样本准确率为52%。其中正样本是指正常交易的样本,负样本是指存在欺诈行为的样本。可以看到,未平衡样本的SVM模型虽然对于正样本的准确率最高,达到99.99%,但是该模型无法识别欺诈样本,负样本准确率为0,失去了预测的意义。OneClassSVM模型对于负样本具有最高的预测准确率,比当前的专家规则方法提高了40.6个百分点,而在正样本的预测上提高了0.4个百分点。对比当前在异常检测中使用较多的高斯分布模型,OneClassSVM模型在负样本的预测准确率上提高了39.2个百分点,正样本上提高了1.3个百分点,对比平衡样本后的SVM模型,OneClassSVM在负样本预测准确率上提高了27.5个百分点,正样本上提高了1.4个百分点,因此说明了OneClassSVM模型的有效性。首先收集相关数据作为样本,并将样本拆分为训练样本以及测试样本。其中训练样本用于模型学习,求取各类参数,测试样本用于测试模型在样本外的效果;其次,使用训练样本对OneClassSVM进行建模,并采用模拟退火法求得最优参数,得到最终的模型;最后,使用测试样本作为输入,利用训练后得到的OneClassSVM进行预测;(4)本文对相关模型进行了实证分析,在测试集上,OneClassSVM模型的正样本准确率为95.2%,负样本准确率为92.6%;高斯分布模型的正样本准确率为93.9%,负样本准确率为63.4%;未平衡样本的SVM模型的正样本准确率为99.99%,但是负样本准确率为0;平衡样本后的SVM模型正样本准确率为94.9%,负样本准确率为65.1%;通过专家规则进行判断的正样本准确率为94.8%,负样本准确率为52%。其中正样本是指正常交易的样本,负样本是指存在欺诈行为的样本。可以看到,未平衡样本的SVM模型虽然对于正样本的准确率最高,达到99.99%,但是该模型无法识别欺诈样本,负样本准确率为0,失去了预测的意义。OneClassSVM模型对于负样本具有最高的预测准确率,比当前的专家规则方法提高了40.6个百分点,而在正样本的预测上提高了0.4个百分点。对比当前在异常检测中使用较多的高斯分布模型,OneClassSVM模型在负样本的预测准确率上提高了39.2个百分点,正样本上提高了1.3个百分点,对比平衡样本后的SVM模型,OneClassSVM在负样本预测准确率上提高了27.5个百分点,正样本上提高了1.4个百分点,因此说明了OneClassSVM模型的有效性。
本文的研究对于提升S银行信用卡反欺诈能力具有重要的现实意义,也对将异常检测模型应用在银行信用卡反欺诈领域提供了参考。