软件缺陷预测模型超参数的稳健优化方法

来源 :山西大学学报(自然科学版) | 被引量 : 0次 | 上传用户:liongliong535
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高性能的软件缺陷预测模型可为软件自动化测试奠定重要的基础.当前的软件缺陷预测模型主要采用机器学习分类算法进行构建.其中,基于集成学习的软件缺陷预测模型通常可以达到当前最优的性能.然而,基于集成学习的软件缺陷预测模型的性能受到分类器的超参数取值的明显影响.因此,如何优化基分类器中的超参数,是提升基于集成学习的软件缺陷预测模型性能的主要问题之一.为此,文章利用稳健设计中的望大特性信噪比,提出了一种基于稳健设计的超参数优化方法.该方法在优化模型性能的同时,还提升了模型性能的稳定性.本文采用支持向量机作为基分类器,采用块正则化m×2交叉验证方法的随机下采样算法来构建集成学习的软件缺陷预测模型.本文在跨版本缺陷预测(CVDP)的16个数据集和跨项目缺陷预测(CPDP)的22个数据集上验证了超参数优化方法的效果.结果 表明(1)基于稳健设计的超参数优化方法可以提高软件缺陷预测模型的预测性能.在CVDP任务上,F1值的平均值可以提升1.2%;在CPDP任务上,F1值的平均值可以提升4.1%.(2)基于稳健设计的超参数优化方法可以提高软件缺陷预测模型的稳定性.在CVDP任务上,F1值的置信区间的平均长度可以缩减3.5%;在CPDP任务上,F1值的置信区间的平均长度可以缩减2.6%.这表明,基于稳健设计的超参数优化方法是有效的.
其他文献
文章研究了带分布时滞分数阶泛函微分方程非振动解的存在性,利用Krasnoselskii不动点定理得到了其一个新的充分条件.
分离时间量子行走包含硬币旋转算符和条件平移算符两种相继作用.文章在这两种算符中分别引入一个可控的参数,同时加入增益损耗算符,构造满足PT对称的一维非幺正量子行走模型.
文章在双击转子模型的Floquet算符中加入可调参数的硬币算符,以此改变每一单步演化后的硬币态,研究可调硬币参数对系统拓扑特性的影响.通过计算系统Floquet准能谱和绕数拓扑
文章研究了一类具有信息干扰和Markov切换的随机传染病模型正解的存在性及灭绝性.通过构造合适的Lyapunov函数得到了模型正解存在性和唯一性的充分条件,利用马尔科夫链的遍历
Suzuki-Miyaura偶联是一种形成碳一碳键、合成联芳基化合物的有效方法,与传统的卤代烃相比,芳香胺类化合物更容易获得,价格上更为便宜,相应的中间体重氮盐在偶联反应中的活性
为实现云存储中的细粒度的访问控制,属性基加密(ABE)被提出,并逐渐成为云环境中最具发展前景的加密算法.但由于ABE采用了双线性对运算,计算效率较低,阻碍ABE在实际中的广泛应
研究一类分数阶微分方程边值问题,利用集合Ph,e上新的不动点定理给出了这类边值问题解的存在性与唯一性结论,并构造了迭代序列来逼近唯一解.最后以一个分数阶三点边值问题为
针对传统的多分类模型学习效率较低,对于复杂的多类别数据无法进行高效分类的问题,提出了一种基于支撑向量机(Support Vector Machine,SVM)的主动多分类方法.该方法通过引入
在许多实际应用领域,特征随时间逐个流进特征空间并需及时进行在线选择,称为在线流特征选择.现有基于邻域粗糙集的在线流特征选择算法,仅考虑条件属性子集正域中包含的信息,
K-近邻技术被广泛用于分类、推荐等热点问题,但针对多元时序数据状态预测问题的解决方案相对较少.文章在三支决策思想的指导下,提出了一种新的状态预测算法及其三支划分策略,