弱标记软件缺陷挖掘系统研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:wenxiaoyan0411
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着软件系统变得越来越复杂,如何保证软件系统的可靠运行,已经成为科研人员所面临的巨大挑战。软件缺陷是软件系统不可靠的主要原因。目前已经有许多关于软件缺陷检测的研究工作,这些工作大多研究某种软件度量的性能或者某个具体软件缺陷检测算法,并且通常需要大量标记样本。实际应用中,由于测试资源的限制软件缺陷检测通常是弱标记的,已有的工作很少考虑弱标记情况下的软件缺陷挖掘。本文对弱标记情况下的软件缺陷挖掘系统实现进行研究和分析,取得了如下创新成果:1.针对弱标记软件缺陷挖掘没有合适的特征集合的问题,采用信息增益对各个软件度量进行特征选择,选择了对软件缺陷挖掘有效的特征集合,这组特征集合可以表征软件模块,为软件缺陷挖掘提供基础。2.针对没有任何软件缺陷标注的情况,提出了通过挖掘软件中的异常模块来找到缺陷风险高的模块的方法,并借助实验对比常见的异常点检测算法在软件缺陷挖掘中的性能,确立了本文系统在没有任何软件模块标注下采用的异常点检测算法,可以在没有任何缺陷标注信息时给用户初始的反馈信息。3.针对有少量软件缺陷标注的情况,提出了通过采用主动半监督学习来对软件中的缺陷模块进行检测的方法,并借助实验对比了主动半监督学习算法和传统机器学习算法的效果,确立了本文系统在有少量软件模块标注下采用主动半监督学习算法对软件工程中的缺陷进行挖掘,减少了用户需要标注的软件缺陷数量。4.基于以上研究工作,本文研制了弱标记情况下的软件缺陷挖掘系统,该系统可以在各种不同的弱标记情况下进行工作,给用户提供软件模块的缺陷信息。
其他文献
随着软件设计结构和代码的复杂化,在软件开发过程中,调试技术越来越重要。调试器,特别是源代码级调试器是目前最方便的调试方式,它可以提供程序源代码、栈、反汇编代码、断点、寄
Web服务具有松散耦合,互操行性强和平台无关等特点,是面向服务体系架构SOA的主要实现方式。基于XML的SOAP协议是Web服务的核心协议之一,它是独立于特定编程语言和平台的可扩展消
本文研究目的是在计算机和手持工具之间或者计算机之间实现数据信息同步时,对数据进行保护。为了验证此目的,运用两台计算机,其中一台配置成SyncML服务器,另一台配置成SyncML客户
随着计算机技术的不断发展,Web已成为人们获取信息的一个重要途径。由于信息技术的高速发展,Internet上的信息资源呈指数膨胀,面对海量数据人们不得不花费大量的时间去搜索、浏
概率主题建模是发现数据中隐藏的主题结构的一类方法。在概率主题建模中引入数据本身具有的标注信息,将无监督概率主题建模拓展成为监督概率主题建模,是概率主题建模的一个重要
本文介绍了一种新型时间自动机模型——有限精度时间自动机。它介于离散时间自动机和连续时间自动机之间,可以描述异步系统并进行相关性质的验证。所谓“有限精度”,是指有限精
数据中心能耗控制与应用服务质量(QoS)优化是当前云计算产业面临的关键问题。在保障应用QoS的前提下,优化整个数据中心资源组合与分配方式,将不同资源需求的应用程序环境(AEs)
目前,我国在许多商业和政府机构、通讯、医院、保险行业中,票据处理是个繁重的劳动。长期以来,票据管理工作因管理手段落后,各类票据的打印、整理、装订和归档需要花费大量的
Internet高速发展使互联网成为人们获取新闻的主要途径之一。但是,面对海量的新闻报道,人们经常会迷失在信息的海洋中。人们希望能够快速准确地从海量的网络新闻报道中获得新闻
聚合k最近邻查询处理技术是近年来数据库领域的一个研究重点与热点,传统的聚合k最近邻查询主要关注欧式空间,并用欧式距离来度量对象之间的邻近关系。路网中的邻近关系不能简单