【摘 要】
:
由于金融机构与信贷申请者间存在信息不对称问题,金融信用数据中数据缺失的情况普遍存在,而数据缺失模式及缺失程度会影响信用风险评估模型的预测准确性.针对复杂缺失模式、
【机 构】
:
厦门大学管理学院,福建厦门361005;厦门大学经济学院,福建厦门361005
论文部分内容阅读
由于金融机构与信贷申请者间存在信息不对称问题,金融信用数据中数据缺失的情况普遍存在,而数据缺失模式及缺失程度会影响信用风险评估模型的预测准确性.针对复杂缺失模式、缺失程度高的信用数据,本文提出两阶段的信用评分模型.该模型能够利用所有的带缺失的数据建模.模型第一阶段根据数据缺失模式,采用Logistic回归与SVM模型对每种缺失模式分别建子模型,对每种缺失模式构建一个模型组,模型组中的各子模型保留了原始带缺失数据的样本量及变量;第二阶段对于每个模型组,基于Jackknife准则的交叉验证方法确定各模型组中子模型的最优权重,并将训练的模型组用于新样本的预测.通过模拟发现,两阶段模型能够提升Logistic与SVM模型的预测效果,且当数据缺失程度增高时,模型效果提升幅度增大.互联网消费金融数据分析结果表明,两阶段信用评分模型能够选择各缺失模式下影响互联网消费金融信用评分的重要变量组合,相比于单一 Logistic与SVM模型,两阶段模型的效果更优.
其他文献
农村义务教育学生营养改善计划自2011年实施以来,在许多地区都取得了积极的效果,但同时也暴露出了许多问题,“营养午餐”变成“免费午餐”;健康教育针对性不强等现状都急需改
随着全球化进程和电子商务蓬勃发展,尤其新冠疫情之外,海外电商模式成为诸多出口型企业的业绩突破点.伴随着海外电商需求增加,海外跨境的业务模式愈加多样化,对于部分财务人
城乡职业收入差距扩大是从传统经济向现代经济转化过程中必然会出现的社会问题。本文以线性回归和分位回归为基础模型,以完整资料分析法和逆概率加权法为参照,提出一种基于线性回归的分数插补法,并通过模拟研究比较两种回归模型背景下分数插补法的统计性质和处理效果。最后,本文利用2015年中国综合社会调查的部分数据,对职业收入的重要影响因素及城乡差异进行实证分析,以期为相关部门制定和落实城乡收入状况改善政策提供一定参考。
赔款准备金评估作为保险精算的一个重要研究领域,对于含有异常值的赔款数据,很多学者不断探索更加合理的赔款准备金评估方法,本文应用稳健统计方法,即假设赔款准备金模型中误差分布服从尺度混合偏正态分布构成的厚尾分布,降低异常值的影响,得到更加合理的评估结果。通过实际数据分析,并与已有的稳健赔款准备金统计方法进行比较,基于尺度混合偏正态分布的稳健赔款准备金评估方法取得比较好的评估结果,具有实际应用价值。
在家暴现象高发的社会背景下,越来越多家庭成员的合法权益遭受侵害.家暴行为不仅破坏着家庭关系,还危及着社会的和谐与稳定,并由此引发了一系列民事、刑事案件.随着社会发展,
股票市场与宏观经济二者理应是相互制约相互影响的,但在中国这种关系似乎不太明显。本文对上海证券股市与GDP的相关程度,以及股市中哪些因素与GDP互相影响进行了研究。首先选取2000-2018年的季度数据,使用软件SPSS运用互谱分析的方法研究CDP与上证指数在长、中、短期的相关程度,得到二者在长期有一定相关性,但并不显著,而中短期的相关性较低。然后确定股票成交金额(TST)、股票流通市值(SMC)、上海平均换手率(SATR)作为股市指标,选取1995-2014年的年度数据,使用软件Eviews建立VAR模型
财务信息失真降低了财务危机预警模型的预测正确率.针对财务指标数据为有界子集的情形,本文引入基于修正Benford因子的财务危机预警Logistic模型,包含代表财务数据质量的修正
随着我国经济水平的迅速提高,我国城市化进程也得到了发展,与此同时,乡村的振兴也受到了社会各领域的广泛重视.在乡村的发展过程中,如果没有优秀基础人才的参与和支持,就无法
近年来皮克斯的动画电影题材内核愈发深刻,一再剖析生活真义,《心灵奇旅》更是将目光聚焦到生之来处,不仅视角独特,其中的剧情设计更可谓精彩绝伦.因此,本文从题材,情节,角色
本文通过Kumaraswamy Marshall-Olkin扩展方法引进并研究了一个新的五参数寿命分布,称为Kumaraswamy Marshall-Olkin Logistic-Exponential分布,它包含六种特殊情形,如Marshall-Olkin Exponential分布,Logistic-Exponential分布等。新分布比它的特殊情形及-些其他分布具有更好的数据拟合性能,其失效率函数主要有六种形状,即S型、常数型、递增的、递减的、浴盆型和倒浴盆型。研究了新分布的性质,得到分位数函数、普