论文部分内容阅读
P2P网络借贷是将资金聚集起来借贷给有资金需求人群的一种商业模型,通过互联网的方式进行借贷,其致力的客群为传统金融无法触及的用户。2007年中国首家P2P网络借贷平台拍拍贷在上海成立,2013年起,网络借贷借势互联网金融的兴起获得了快速发展,2016年中国网络信贷用户达到1.6亿人,P2P交易规模达到14955.1亿元。然而P2P网络借贷业务的几何式增长并不能代表P2P网络借贷平台的成熟,作为一种信贷业务,P2P网络借贷公司规模普遍较小,其风险管理能力远远低于商业银行,因而其面对的最大风险就在于信用风险。个人信用评估实质上可以看作为一个二分类问题,本文以个人信用评估方法作为研究对象,针对寻常的欠抽样方法会造成数据信息的缺失的问题,本文提出基于boosting的欠抽样方法与基于支持向量机模型获得的支持向量样本进行过抽样产生新样本数据的方法相结合,对不平衡数据进行处理,结果表明该方法对不平衡样本进行处理后,模型的ROC曲线面积、预测召回率均有明显提升,且该方法在严重不均衡的数据上具有更明显的优势。其次,本文以lending club网站数据为例,通过分析网站用户基本信息得到违约用户的基本画像,利用GBDT、随机森林、逻辑回归方法以及支持向量机模型进行预测,结果发现,随机森林的预测效果最好,支持向量机预测时间复杂度最高,逻辑回归方法较其他方法具有更强的鲁棒性且时间复杂度最低,但是相比其他三种模型而言其预测精度较低。