基于集成混合采样的软件缺陷预测研究

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:waxs8520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对软件缺陷预测的不平衡问题进行了研究,提出了一种处理不平衡数据的采样方法,用来解决分类器因为样本集中的样本类别不平衡而造成分类器性能下降的问题。为了避免随机采样的盲目性,利用启发性的混合采样方法来平衡数据,针对少数类采用SMOTE过采样,对多数类采用K-Means聚类降采样,然后综合利用多个单分类器来进行投票集成预测分类。实验结果表明,混合采样与集成学习相结合的软件缺陷预测方法具有较好的分类效果,在获得较高的查全率的同时还能显著降低误报率。
其他文献
新富农阶层是全面抗战时期中共在革命根据地鼓励发展生产而出现的新阶层。作为阶级成分的新富农阶层,一方面是新民主主义经济政策在以陕甘宁边区为代表的抗日民主革命根据地
基于位置社交网络的服务层出不穷,而地点推荐系统是其最主要的应用之一。目前地点推荐算法均致力于提高用户对地点的兴趣度预测,没有考虑时间因素对推荐结果的影响。事实上人
对照幼儿教师专业标准,如何不断提升自己的专业素养,做优秀幼儿教师呢?本文对照幼儿教师专业标准,从倾情幼教"爱"当头、提升水平"研"为先、幼教路上"学"无境三个角度,阐述了