【摘 要】
:
软件缺陷(Software Defect)可被定义为发生在软件文档、软件程序及软件数据中不应存在的或不能被接受的误差。随着软件需要和现代技术的不断提升,软件行业迅速发展。由于软件开发大部分过程都是由人完成的,开发过程中会不可避免地产生缺陷。与此同时,软件产品数量不断增加。因此,管理软件缺陷至关重要,这将提高缺陷修复效率、减少缺陷修复时间、节约缺陷修复成本和提高软件质量,还能为软件更新与开发提供数据
论文部分内容阅读
软件缺陷(Software Defect)可被定义为发生在软件文档、软件程序及软件数据中不应存在的或不能被接受的误差。随着软件需要和现代技术的不断提升,软件行业迅速发展。由于软件开发大部分过程都是由人完成的,开发过程中会不可避免地产生缺陷。与此同时,软件产品数量不断增加。因此,管理软件缺陷至关重要,这将提高缺陷修复效率、减少缺陷修复时间、节约缺陷修复成本和提高软件质量,还能为软件更新与开发提供数据经验,从而减少缺陷的再次产生。所以缺陷自动分析对于软件修复有着重要的理论意义和应用价值。缺陷报告是缺陷被测试出来后由测试人员编写的文本,由于缺陷报告数据量大且冗余信息比较多,修复人员难以快速获得缺陷修复信息,导致人工分析缺陷报告效率低,因此自动将缺陷分类并分析出潜在含义提供给修复人员将会提高修复人员修复效率。无监督机器学习方法中的聚类利用数据驱动进行分类,不需要人工标注且省时高效,此外,关键词提取可快速提取该类缺陷的关键词提供给修复人员。因此,提出一种基于聚类的软件缺陷分类方法,在此基础上使用关键词提取的方法获取每类缺陷的关键词提供给软件修复人员。具体工作如下:1.从缺陷管理软件中获取部分缺陷的完整报告。缺陷管理主要是指对缺陷有效地记录、采集和统计。在缺陷管理软件中,本文选用bugzilla,但该工具仅仅记录缺陷的属性、事务、统计信息等,接下来还需对缺陷报告的数据展开更深入地研究。因此首先从bugzilla中下载部分缺陷的完整报告,以便后续分析。2.为软件缺陷聚类,将缺陷报告中所有缺陷进行归类。获取到缺陷报告后,使用聚类的方法将缺陷分成不同的类别,聚类过程主要分为预处理、有效特征提取、文本表示和聚类四个步骤。首先在获取缺陷报告后,将缺陷报告中部分信息提取出来;然后对缺陷信息预处理;接着提取和缺陷有关的有效特征,使聚类更加准确;再利用文本表示将自然语言转化为计算机可识别形式;最后使用K-Means方法对缺陷聚类,以便后续对缺陷的分析,这里缺陷一共分为六类。3.提取每类缺陷的关键词。缺陷聚类后,只为修复人员提供缺陷类别是不够的,该信息只能使修复人员了解哪些缺陷是相似的,并不能使修复人员快速了解这一类缺陷如何修复。因此,在获取到缺陷类别信息的基础上,使用LDA方法将每一类缺陷的关键词准确地提取出来,使修复人员快速了解该类缺陷并找到相应的解决方法。4.得到提取结果后,以标签的形式返回缺陷报告中。经过聚类和关键词提取后的结果将以文件夹方式呈现,这使修复人员在修复过程中查看缺陷报告时需要对比缺陷id进行查找,增加修复时间。因此把提取结果以标签的形式插入缺陷报告中提供给修复人员,使修复人员首次查看缺陷报告时快速了解缺陷相关信息,减少修复时间。
其他文献
随着公路路网的日益健全、公路里程的持续增长,路政管理的工作量也在不断增加。尽管路政管理工作取得了一定的成绩,但是路政管理中的一些问题也逐渐浮出水面,例如效率低下,办
研究城市形态形成的原因以及一般性的方式方法,是对于城市形态研究的宏观、中观知识的整体把控,有利于了解城市发展历史、未来的规律性变化。本文以月坛街区为例,通过对比不同历史时期的城市形态演变差异及影响因素,理解城市形态演变体系。在城市化的进程中,政治、社会生产力、制度以及人们的生活、交流方式等因子都对城市形态产生了潜移默化地影响。城市发展最终所呈现出的空间意识外形,是各个时期受到多样化因子影响下所产生
超材料是一种以人造基本单元作为“原子”组成的人工材料,拥有许多自然材料中不存在的奇特电磁性质。在美国顶级学术期刊《Science》每年一度的“年度十大科学进展”评选中,
近年来,我国老年人口总数上升,社会老龄化趋势明显,养老产业市场容量急速膨胀。为满足我国养老需求及促进国家相关规划落实推进,多渠道募集资金、多方位提供服务、多元运行模
研究目的:在体育运动项目中,许多项目会要求运动员做频繁快速的跑动,在这个过程中膝关节需要做反复的屈伸运动,起着至关重要的作用。但膝关节前后肌群力量的不平衡,容易造成
翻滚作为道路交通事故中相较特殊的一种碰撞形态,具有发生率低,伤亡率高的特点,同时也是成因最为复杂,影响因素最多的事故类型。然而当前国外在车辆翻滚领域的研究仍然存在很
随着我国山区高速公路建设的迅速开展,不可避免地将在富含炭质泥岩地区修建高速公路。但是,由于炭质泥岩遇水软化特性,很容易导致路堑边坡坍塌、滑坡等地质灾害的发生,特别是
小学《道德与法治》是由教育部组织统一编写,由人民教育出版社出版并发行,是代替小学《品德与生活》、《品德与社会》的新课程、新教材,尽管名称发生了改变,但课程的基本性质不变。《道德与法治》课程仍然是一门综合课程,并以主题单元为单位进行教材设计与编写。变构学习模型是日内瓦大学的安德烈·焦尔当于20世纪80年代中后期发布的对学习的新解释模型,它揭示了学习发生的复杂机理。本研究在对相关文献进行综述的基础之上
汽车智能交通高级驾驶辅助系统(ADAS)作为提高道路交通安全的有效技术,引起了国内外学者的高度关注,其中的道路视觉感知技术更是车路环境研究工作不可或缺的部分。本文基于当前的车路环境视觉感知技术,对复杂车路视觉图像的获取技术和融合处理技术进行了研究。本文首先以蒙特卡罗方法模拟光波在复杂车路环境散射介质中的传播过程为基础,构建复杂介质中的成像数学模型,对系统成像参数进行优化,并给出复杂介质环境中的图像
图像分类是指根据一定的分类规则将图像自动分到一组预定义类别中的过程,它可以应用于许多领域,如人脸识别和医疗图像处理。传统的图像分类方法一般是使用人工设定的特征模式