机器学习模型测评技术研究与实现

来源 :北京邮电大学 | 被引量 : 8次 | 上传用户:wanxlm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来及计算机技术的发展,人工智能由过去主要依靠专家系统实现变为通过算法实现,机器学习是众多算法的重要分支。机器学习以“模型”形式应用于人工智能软件中,“模型”质量的优劣很大程度上决定了人工智能应用的最终效果。对机器学习模型进行测评是保证“模型”和人工智能应用质量的重要手段。目前,在机器学习模型的性能和稳定性测评方面已有一定研究,但尚未形成完整的测评指标体系,且在测评模型鲁棒性方面存在一定研究空白。本文围绕“如何定义机器学习模型质量”、“如何构建测评指标体系与评价模型”、“如何实施测评”的问题展开研究,构建机器学习模型质量模型、测评指标体系、综合评价模型,提出相关测评技术,并进行指标处理。本研究为测评机器学习模型质量提供全面的指标体系和模型鲁棒性测评思路,在保证模型质量和人工智能应用质量方面有一定意义。首先,提出机器学习模型测评的概念、测评内容、方法分类,并对比分析机器学习模型测评与软件测评的异同,在深入分析机器学习模型特性基础上,提取模型的6个质量要素,即“性能”、“稳定性”、“鲁棒性”、“可实践性”、“工程效率”、“代码安全性”,并建立层次化的初始指标体系。接着,通过文献分析法提炼指标构建原则,并针对机器学习模型面向具体任务的特点,提出基于二次筛选的指标体系构建方法,分别是采用定性分析法做第一次筛选,采取专家问卷调查法与定性分析结合的方法做第二次筛选。接着,针对机器学习模型质量需求多变,指标较多的特点,提出简化的构造判断矩阵的方法,减少了人工定性比较的次数,利用层次分析法确定指标权重,并用所提方法建立手写数字识别模型的指标体系。其次,提出模型数学属性测评的形式化流程。接着对手写数字识别模型和软件缺陷预测模型的性能进行测试,分析了性能度量指标的有效性和局限性。接着提出第一类鲁棒性度量指标robustness1,并实验验证了指标的有效性。接着在深入分析对抗样本构造原理的基础上,定义了第二类鲁棒性的度量指标Defense,即模型对攻击的防御能力,提出基于对抗样本攻击的第二类鲁棒性测评方法,并实验验证所提指标和测评方法的有效性。接着对各指标进行一致化和无量纲化处理。最后,在理论研究基础上,进行图片分类模型测评系统的设计与实现,并用花卉识别的DNN模型、CNN模型、基于Inception V3的模型进行系统验证。本文重点研究了机器学习模型测评指标体系和模型数学属性的测评技术,所提第一类鲁棒性度量指标能够区分模型对合理性异常数据的处理能力,所提第二类鲁棒性度量指标能够区分模型对对抗样本攻击的抵抗能力。
其他文献
为解决装配式建筑施工安全评价指标的模糊不确定性、随机性和指标间非线性关系造成专家难以洞察指标全部信息,从而降低评价结果科学性的难题,提出了基于ICUOWGA-RBF神经网络
本试验旨在研究大豆异黄酮对泌乳后期中国荷斯坦奶牛泌乳性能、免疫功能和乳腺肥大细胞白介素-4水平的影响。选择12头泌乳后期的荷斯坦奶牛随机分为4组,每组3个重复。对照组
《山海经》与中国奇幻思维宁稼雨华夏民族素以实际、平和和中庸著称,这些基本素质与奇幻思维几乎是相悖的.但是,这并不应当成为我们无视甚至否认这个民族曾经或仍然具有奇幻思维
构成马克思哲学自然观的基本特征,或者说把马克思的自然观与一切旧唯物主义自然观区别开来的本质之点,是马克思哲学视野中“自然”的社会-历史性质。换言之,“人化自然”是马
现阶段,社会发展过程中的能演消耗问题越来越严重,从而凸显出节能的重要价值。机械设计专业也不例外,已经对节能设计给予了高度重视,致力于借助合理化的设计,达到降低能源浪
<正>牛顿第二定律是牛顿力学的科学核心.如何帮助高中学生正确理解牛顿第二定律,适度拓展牛顿第二定律的解题功能,从而应用牛顿第二定律更好地解决实际问题?笔者在教学实践中
陈寅恪的学术研究、诗文创作和为人处事,均与中国知识分子的人格承担密切相关。本文从三个方面讨论陈寅恪关于“知识分子人格承担”的理论及实践:忧虑文化转型期知识分子的角
以Freescale公司的i.MX6Q四核处理器及ALTERAEP3C40F324FPGA为核心的嵌入式硬件平台,介绍i.MX6Q与FPGA基于EIM总线通信接口设计.基于Linux3.0.35内核开发此接口的驱动程序方法以及
本研究对比Q开关翠绿宝石755 nm激光和Q开关Nd:YAG1 064 nm激光治疗太田痣的疗效和差别,探讨分析原因。分别用Q开关翠绿宝石755 nm激光和Q开关Nd:YAG1 064 nm激光治疗637例太