论文部分内容阅读
信贷风险是金融机构风险的主要来源。随着个人住房贷款业务的不断扩大,银行如何建立有效的风险防范机制显得十分重要。课题以建设银行大连分行的综合信息平台为基础,对该平台的企业风险管理模块中个人住房贷款信用风险评估进行了深入研究,实现了一个基于粗集和支持向量机的信用风险评估系统。 数据挖掘是一种从大量复杂的数据中迅速获取新颖、有效知识的新技术。分类是一种最常见的数据挖掘任务,它通过经验数据训练得到的分类器来预测未知数据的类别。 支持向量机是基于VC维和统计学习理论理念的数据挖掘中的一种新方法。其核心思想是将一个复杂的分类任务通过核函数映射使之转化成一个在高维特征空间中构造线性分类超平面的问题。它在解决两类问题是一种较好的分类方法,同时学习结果模型有较强的稳定性。结合粗糙集的属性约简和支持向量机的分类机理,给出了一种混合算法,最后的试验结果说明了所提方法的有效性,提高了预测准确率和预测速度。 本文首先介绍了课题的研究内容和问题、个人住房贷款的现状和现存的个人信用评估方法,提出了一种改进的个人信用评估方法。然后介绍了数据挖掘中常用的分类方法,通过比较各种分类方法的优缺点,给出了本文选用支持向量机的原因。 其次,深入研究了支持向量机的理论和算法。对三种训练算法优缺点进行了比较,最后选择了Platt提出的序列最小最优化算法。对粗糙集的理论和属性约简算法进行了研究和比较,最后选择使用了基于属性重要性的约简算法。 接着,从综合信息平台采集分类挖掘所需数据,并进行了抽取和预处理。对支持向量机在信用评估应用中的问题进行了研究和解决,如核函数选取,参数选取,样本非均衡问题等。实验得出本实际应用中径向基模型较好,采用Grid-search方法调整参数,达到了更好的推广能力和预测结果,用分别惩罚支持向量机能有效解决样本非均衡问题。 再次,设计和实现了基于粗集和支持向量机的个人住房贷款信用风险评估原型系统,把该系统应用于建行大连分行个人住房贷款信用风险评估。试验结果也证明了改进后的个人信用评估方法优于原有的打分方法。 最后对全文的工作进行了总结和展望。