基于改进的决策树信用评价模型研究及其工具实现

被引量 : 20次 | 上传用户:hengkuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信用风险是影响商业银行安全高效运营的主要原因。企业作为银行贷款业务的核心主体,其生产经营活动状况的好坏,行为的规范与否,直接关系到银行信贷资金使用好坏和效益高低。这就要求银行对企业的经营活动、经营成果、获利能力、偿债能力等给予科学的评价,以确定是否发放贷款。目前在解决分类问题的各种方法中,决策树是运用最广泛并且效果较好的一种。本文主要是在现有决策树模型的基础上进行改进以形成一个信用评级工具并以此改进的模型进行实证研究,验证其效率以及正确率确实较传统的决策树模型有所提高。本文的核心工作首先是针对决策树中C4.5算法在连续属性离散化处理时存在的缺点:其在寻求最佳分割点的时候需要对数据集进行多次的顺序扫描和排序,并且要多次重复计算以选出最佳分割点,尤其在存在多个属性并且每个属性具有很多个取值时,计算量将会非常大,因而导致算法的低效。基于此,本文提出一种边界点合并的算法,也就是直接用简单的规则对边界点集合进行合并以得到备选最优切点几个,改变了传统方法遍历寻求最佳分割切点的过程,节省了离散化的计算量,使其在离散化的有效性和效率上达到了一种平衡。其次本文对C4.5算法中的剪枝算法也进行了改进,引入了条件误差的剪枝方法以进一步提高其分类正确率。然后,对企业进行分类实证研究,比较改进前后的正确率。最后本文设计实现一个简单的信用评级工具,能够导入数据集,形成离散化方案,最终得出分类结果。
其他文献
中国高校俄语教学可持续发展必须正视中学俄语学生断档和当前我国高校俄语教学中师资队伍结构不合理、教学方法陈旧、跨文化意识不足、教材落后等现实。深化教学改革背景下加
本文对论文下载次数的统计性质的研究必要性以及已有研究的主要内容进行了论述和综合。以实证研究的方式对下载次数的性质进行研究,包括下载和其他指标的关系,期刊论文下载次
对蒸汽喷射器内工质的工作原理进行了分析,建立了蒸汽喷射器的设计计算的简化数学模型,并通过计算获得蒸汽喷射器的一些重要几何参数,从而为蒸汽喷射器的设计提供一种较为简
<正>2017年是极其重要的一年,党的十九大胜利召开,标志各项事业进入中国特色社会主义新时代,建设生态文明成为中华民族永续发展的千年大计。在中央环保督察高压、环保标准加
期刊
水彩画的当代性带来了观念、形式语言、视觉形态的转型,对水彩画教学与创作提出了新要求,在教学中融入当代理念,辩证地接纳传统,注重创新意识培养,以具体的实施策略改变水彩画传统
现代社会是信息化爆炸的时代,大家更愿意接受简单、便捷、高效、有趣的学习和生活方式,教学也是如此。在传统的教学过程中,教师除日常课堂教学只能保证大部分的学生学习进度,
随着大数据时代的来临,现有的预防医学人才培养模式存在弊端。以学生为本的新型培养模式应充分利用大数据资源,在培养学生理论和实践技能的基础上提高综合素质,为学生未来发
新课程实施以来学生评价改革包括五个方面:学生评价理念的变革,日常学生评价实践的改革与研究,高利害学生评价体系的实践探索与研究,综合素质评价的实施与挑战,大规模教育考
语言与文化是相辅相成的。习语谚语,作为语言文化的特殊表现形式,折射出一种语言所代表的地域风貌特性、历史习俗传统、民族心理意识和文化形成过程等一系列因素。英汉谚语的