论文部分内容阅读
信用债券是企业获取资金的重要来源之一,近几年我国债券市场发展十分迅猛,目前规模已稳居全球第二,其中信用债券种类日渐多样化,构造愈加复杂化。随着国内外经济风险的凸显,相应的债券信用风险连带攀升,过去的5年时间内,债券违约数量与规模爆炸式上升,种类跨央企与民企,影响力甚至覆盖到公募基金。因此,及时锁定债券违约的研究具有必要性,相关预测具有现实效用。另外,有助于深化我国对于信用风险的认识,帮助企业者提前识别与防范风险,更有利于政府规划相关政策,维护债券市场高效稳定的发展。
随着金融科技的不断发展,大数据、人工智能为各领域研究带来新灵感,各种数据挖掘算法带来的突出应用效果被各领域所看到并采纳。债券风险研究也开始攻关相关的算法问题。本文基于七种基本学习算法对比分析,择优三种作为底层算法,即RandomForest算法、GBDT算法与Bayes算法,并结合LR算法为次级训练算法融合构成新的Stacking算法。
首先,根据近五年违约案例违约原因分析及相关学者研究角度归纳总结,从债券资质、债务主体、财务数据、宏观方面四个维度出发获取实验数据。其次,经过随机森林重要性分析挖掘重要影响指标,主要影响因素在保留18项与37项时,样本内外预测结果达到均衡。分析保留指标的所属类别,重要性呈现自上而下的表现,即宏观经济与外部融资压力影响较大,其次为公司的整体实力、盈利能力与资金周转能力,最后为公司的未来发展质量。
然后,对模型进行评估。第一,对择优的三种底层算法与构建的Stacking模型的预测能力进行比较分析,在整体精确度上,Stacking算法的双重集成作用相对底层的单次集成总体精确度提升1%到8%;在F1度量指标中,平均约提高6%;第二,对不同数量的指标进行模型验证,最终构建的指标体系提升了预测水平;第三,基于样本内外预测均衡的底层算法选择方法有效可取,Stacking模型有利于弥补包括线性模型在内的不同研究方法的劣势因素。F1
最后,基于模型研究,提出三点建议,即政府监管应扩大范围,债券违约不存在安全区;各评级机构应保留超前意识,及时跟进债券评级预测问题;2020疫情突发,中小企业应对能力有限,债券防控问题更应重视。
随着金融科技的不断发展,大数据、人工智能为各领域研究带来新灵感,各种数据挖掘算法带来的突出应用效果被各领域所看到并采纳。债券风险研究也开始攻关相关的算法问题。本文基于七种基本学习算法对比分析,择优三种作为底层算法,即RandomForest算法、GBDT算法与Bayes算法,并结合LR算法为次级训练算法融合构成新的Stacking算法。
首先,根据近五年违约案例违约原因分析及相关学者研究角度归纳总结,从债券资质、债务主体、财务数据、宏观方面四个维度出发获取实验数据。其次,经过随机森林重要性分析挖掘重要影响指标,主要影响因素在保留18项与37项时,样本内外预测结果达到均衡。分析保留指标的所属类别,重要性呈现自上而下的表现,即宏观经济与外部融资压力影响较大,其次为公司的整体实力、盈利能力与资金周转能力,最后为公司的未来发展质量。
然后,对模型进行评估。第一,对择优的三种底层算法与构建的Stacking模型的预测能力进行比较分析,在整体精确度上,Stacking算法的双重集成作用相对底层的单次集成总体精确度提升1%到8%;在F1度量指标中,平均约提高6%;第二,对不同数量的指标进行模型验证,最终构建的指标体系提升了预测水平;第三,基于样本内外预测均衡的底层算法选择方法有效可取,Stacking模型有利于弥补包括线性模型在内的不同研究方法的劣势因素。F1
最后,基于模型研究,提出三点建议,即政府监管应扩大范围,债券违约不存在安全区;各评级机构应保留超前意识,及时跟进债券评级预测问题;2020疫情突发,中小企业应对能力有限,债券防控问题更应重视。