【摘 要】
:
Many software projects use bug tracking systems to collect and allocate the bug reports,but the priority assignment tasks become difficult to be completed because of the increasing bug reports.In orde
【机 构】
:
Information Science and Technology College,Dalian Maritime University,Dalian,116026,China
【出 处】
:
第六届中国计算机学会大数据学术会议
论文部分内容阅读
Many software projects use bug tracking systems to collect and allocate the bug reports,but the priority assignment tasks become difficult to be completed because of the increasing bug reports.In order to assist developers to reduce the pressure on assigning the priority for each bug report,we propose an integration method to predict priority levels based on machine learning.Our approach considers the textual description in bug reports as features and feeds these features to three different classifiers.We utilize these classifiers to predict the bug reports with unknown type and obtain three different results.Simultaneously,we set weights to balance the abilities of identifying different categories based on the characteristics of different projects for each classifier.Finally,we utilize the weights to adjust prediction results and produce a unique priority for assigning to each bug reports.We perform experiments on datasets from 4 products in Mozilla and the experimental results show that our approach has a better performance in terms of identifying the priority of bug reports than previous general methods and ensemble methods.
其他文献
岩土结构物变形与稳定性评估的准确性往往取决于地层描述的精确程度.实际地层往往表现出变异性,材料分类模型能够对地层变异性进行有效地描述,目前常用的材料分类模型有主要有耦合马尔可夫链和广义耦合马尔可夫链,目前的研究中并未对两种模型进行系统的比较,给工程师们在模型选择方面带来困难.为此,以香港地区某场地地层为例,对两种材料分类模型的转移概率矩阵、信息熵图、地层变异模拟结果等方面进行系统的比较.结果表明:
目前的RC框架结构地震易损性分析大都采用理论分析法,建模过程忽略了土与上部结构的相互作用(SSI),同时广泛采用的层间位移角方法不能准确反应结构在地震作用下损伤机理.本文基于现有损伤模型的对比分析,提出了一种最大变形和滞回耗能非线性组合的改进双参数损伤模型,采用实验数据进行验证.并以8层RC框架结构为例,进行50条地震波作用下的结构增量动力分析,分别绘制了变形和能量两种单参数模型以及Park-An
本文将地震动加速度过程分解为两个独立的随机过程:第一个随机过程为已知演变功率谱的全非平稳地震动过程,应用非平稳过程模拟的谱表示-随机函数方法,即可生成代表性样本集合及其平均反应谱;第二个随机过程为修正的非平稳地震动过程,其功率谱密度函数由第一个随机过程的平均反应谱与规范反应谱的拟合误差来计算.通过第二个随机过程演变功率谱的修正,即可生成与规范反应谱拟合一致的全非平稳地震动加速度代表性样本,实现了地
土水特征曲线(SwCC)描述了非饱和土中体积含水量(或有效饱和度)与压力水头(或基质吸力)之间的关系.SWCC作为非饱和土力学中的基本函数,可用于研究非饱和土的抗剪强度、渗透特性以及变形特性等,在非饱和土力学应用中发挥着重要作用.工程实践中,通常可采用直接试验方法测得SWCC数据.由于直接试验方法条件苛刻且耗时较长,难以获得体积含水量范围内完整的SWCC数据.在有限试验数据条件下,如何更好的选择S
本文有效考虑管理不当引起的堤防溃决风险的影响,识别了堤防工程系统的23个风险因子.为方便风险因子量化,将其划分为12个定量因子和11个定性因子,并分别基于无量纲处理法和专家评分法对其进行量化.在此基础上对每个风险因子进行赋权处理并计算堤防工程系统综合风险评价值.最后,以鄱阳湖区矶山联堤防实例验证了提出方法的有效性,研究成果可为制定堤防风险管理决策提供理论和技术支持.
机器学习在网络入侵检测中的应用已经受到各界广泛关注,应用的算法主要是决策树、随机森林、logit、KNN等机器学习模型,这些算法发布时间较长、应用成熟、发掘潜力有限.Xgboost算法推出时间相对较晚,在网络入侵检测中的研究较少.文章以此为研究对象,基于入侵检测数据集KDD99,使用logit、KNN、决策树、随机森林、Xgboost等机器学习模型分别进行5折交叉验证,计算和比较这些算法的识别效果
High-quality image deconvolution is required for many image processing applications.Our work concentrates on portraying a new image deconvolution method based on Retinex prior knowledge.We build a new
每年秋冬季节,也是中国北方大部分城市的雾霾多发季节,而且随着最近几年城市私家车保有量的提升以及冬季取暖等其它污染源的增加,雾霾呈现出越来越严重的态势,严重影响人们的生活和健康.当前对于雾霾的主要防治措施主要为污染源的治理和生活办公区域的空气净化.该文设计出一种新型的“负离子雾霾收集器”,该设备充分利用电子流动裹着雾霾颗粒除霾,纯物理过程,非常安全,利用电子流动裹着雾霾颗粒除霾,纯物理过程,非常安全
问句实体链接是问答系统的重要步骤之一,传统的方法都是先识别出问句中的命名实体,然后再链接到知识库,这需要大量的数据处理和特征选择工作,而且容易造成错误累积,降低链接效果.针对这种情况,本文提出基于注意力机制的编码器—解码器实体链接模型AMEDEL.该模型使用双向的长短期记忆网络对问句进行编码,经过注意力机制解码,生成对应的实体指称和消歧信息输出,最后再链接到知识库实体.在有关汽车领域车系产品问句和
Sleep staging has attracted significant attention as a critical step in auxiliary diagnosis of sleep disease.To avoid subjectivity in the process of doctors manual sleep staging,and to realize scienti