【摘 要】
:
在深度强化学习(Deep Reinforcement Learning,DRL)中,智能体(agent)通过观察通道来观察环境状态.该观察可能包含对抗性攻击的干扰,也即对抗样本,使智能体选择了错误动作.生成对抗样本常用方法是采用随机梯度下降方法.提出使用拟双曲动量梯度算法(QHM)来生成对抗干扰,该方法能够充分利用以前的梯度动量来修正梯度下降方向,因而比采用随机梯度下降方法(SGD)在生成对抗样本上具有更高效率.同时借助这种攻击方法在鲁棒控制框架内训练了DRL鲁棒性.实验效果表明基于QHM训练方法的DRL
【机 构】
:
浙江师范大学 数学与计算机科学学院,浙江 金华 321004
论文部分内容阅读
在深度强化学习(Deep Reinforcement Learning,DRL)中,智能体(agent)通过观察通道来观察环境状态.该观察可能包含对抗性攻击的干扰,也即对抗样本,使智能体选择了错误动作.生成对抗样本常用方法是采用随机梯度下降方法.提出使用拟双曲动量梯度算法(QHM)来生成对抗干扰,该方法能够充分利用以前的梯度动量来修正梯度下降方向,因而比采用随机梯度下降方法(SGD)在生成对抗样本上具有更高效率.同时借助这种攻击方法在鲁棒控制框架内训练了DRL鲁棒性.实验效果表明基于QHM训练方法的DRL在进行对抗性训练后,面对攻击和环境参数变化时的鲁棒性显著提高.
其他文献
从第一次全国污染源普查到第二次全国污染源普查,十年间,湖北省社会经济飞速发展,环境形势也发生了很大的变化.工业源是两次污染源普查的主要对象.比较两次污染源普查中的工业源数据发现,十年间湖北省工业源数量增长67.44%,工业总产值增加197.71%,同时工业产业结构明显优化,污染治理能力显著提升,污染物排放量大幅下降,展现了湖北省保护生态环境、促进高质量发展取得的巨大成就.但是,从湖北省第二次全国污染源普查数据同样可以看到,当前工业源仍是部分污染物的主要来源,工业污染结构性问题依然突出,部分行业污染物治理水
彝族服饰是我国少数民族服饰中极具代表性的一种.彝族人民热情奔放,用自己的勤劳和智慧创造了独具特色的民族文化,通常在服饰的纹样、图案结构上运用丰富的数学文化,使数学文化中的数学思想、对称美在彝族服饰中得到充分体现,同时,在民族地区数学教育中也发挥着非常重要的作用.文章主要对数学文化进行概述,并分析其与彝族服饰的整合,以供服装设计师参考.
侗族源自百越族系,主要聚集在我国黔东南地区与铜仁市等区域.侗族是一个爱美、善于创造美且极具浪漫诗情的民族,侗族服饰不仅承载了侗族千百年来的历史,还展示了侗族人民的审美文化与技艺.同时,侗族服饰中蕴含着大量的数学文化,这些都为少数民族地区的数学教学提供了丰富的教学资源,提高了教学效果,促进了侗族服饰文化的传承与发展.文章以黎平尚重侗族为例,对侗族服饰中的数学文化进行了阐述.
现如今,以织物材料为基础的织物艺术已经成为室内设计的重要元素,是协调室内空间关系、注入美学价值的重要途径之一.用于室内空间装饰的纺织品的材质、色带以及形状多种多样,能根据室内空间的整体效果和人们的喜好选择,充分协调室内空间关系.文章分析纺织品织物艺术和室内空间的关系,提出在室内空间运用纺织品织物艺术的策略.
文章通过对善化寺大雄宝殿进行实地考察,分类研究了二十四诸天彩塑,对比同类装扮的彩塑服饰特点,分析彩塑服饰表现出来的汉族服饰文化与少数民族服饰文化融合的特殊性,同时融入现代新材料、新技术,以期在服装设计领域有所启发与创新运用.
清华大学郑莉教授主编的教材《C++语言程序设计》(第5版)(ISBN:9787302566915),于2020年11月由清华大学出版社出版.该书第一版于1999年12月出版,随后经过4次修订,形成了目前的第5版.rn该书先后被评为“北京高等教育精品教材”“普通高等教育\'十一五\'国家级规划教材”“\'十二五\'普通高等教育本科国家级规划教材”“普通高等教育国家级精品教材”“清华大学优秀教材特等奖”等.2021年该书荣获“首届全国教材建设奖全国优秀教材(高等教育类)一等奖”.
对上市公司发布的文本信息披露进行分析是投资者了解公司经营状况、做出投资决策的重要途径,然而人工阅读和分析的方法存在效率低、成本高等问题.人工智能技术的发展则为文本信息的智能分析提供了契机,能够从海量企业文本数据中挖掘有价值的信息,充分发挥数据驱动的优势,大幅度提高分析效率,成为近些年的研究热点.对近十年关于上市公司文本信息披露智能分析的研究工作进行了总结,分别从文本信息披露的事件类型的研究现状、智能分析方法和应用场景三个方面进行了归纳,分析了该领域当前面临的挑战,最后根据现有方法的不足指出了未来可能的研究
随着交通运输业的蓬勃发展,机动车保有量急剧增长,从而导致燃油过度消耗与排放,引发了能源短缺与环境污染等问题.国内外学者致力于机动车燃油消耗模型的研究,旨在提高模型的准确率,降低车辆的燃油消耗,响应可持续发展战略.对此,依据不同的视角,将机动车的燃油消耗模型分为基于汽车动力学原理的传统油耗模型和基于机器学习方法的数据驱动油耗模型两大类.将这两大类的燃油消耗模型又分为各小类分别进行介绍,内容包含各类模型的发展历程、优缺点与对比分析,并对各类模型的应用现状进行概述,对未来应用发展方向进行探讨.最后对机动车的燃油
跨年龄人脸识别是目前人脸识别中的一大难点问题,人脸特征会随着年龄的增长发生变化,导致识别准确率降低,利用老化模型生成老化图像后进行人脸识别为该问题提供了一种解决方案.随着计算机技术和深度学习的广泛应用,人脸老化的真实性、老化效果、算法效率都得到了明显的提升,系统综述了基于老化模型的跨年龄人脸识别的研究现状,对人脸老化方法进行了详细地梳理,系统介绍了老化模型的方法演变和各类方法的优缺点,并对现有的模型评价方法进行了总结归纳.对现有的可用于跨年龄人脸识别的数据集进行了详细介绍,从数据量、年龄跨度、年龄准确性、
针对基本灰狼优化算法在求解复杂问题时,存在依赖初始种群、过早收敛和易陷入局部最优等缺点,提出一种融合正弦控制因子和量子局部搜索的灰狼优化算法(QGWO).通过对灰狼算法中的控制因子按照具有正弦变化的曲线变化,使改进后的算法在迭代前期加快收敛速度以快速完成全局搜索,并且在迭代后期减缓收敛速度以提高算法精度.引入量子局部搜索降低算法陷入局部最优的概率.选用12个标准测试函数对QGWO算法性能进行验证,分别从单峰、多峰和固定维测试函数对比分析.实验结果表明,与GWO、WOA、SCA和CGWO相比,QGWO对测试