【摘 要】
:
智能生产线在当代工业生产中有着越来越广泛的应用,对智能生产线进行最优调度是被证明的 NP 难问题.本文采用深度强化学习方法,基于 DQN(Deep Q Learning) 算法提出了 RGV-DQ
【机 构】
:
山东大学数学学院,山东 济南,250100
论文部分内容阅读
智能生产线在当代工业生产中有着越来越广泛的应用,对智能生产线进行最优调度是被证明的 NP 难问题.本文采用深度强化学习方法,基于 DQN(Deep Q Learning) 算法提出了 RGV-DQN 算法模型(简称 R-DQN) 解决了一个由 8台计算机数控机床、1 辆轨道式自动引导车、1 条 RGV 直线轨道、1 条上料传送带、1 条下料传送带组成的智能生产线系统的最优调度问题.R-DQN 首先将动态模型转化为马尔可夫决策过程、然后根据智能体运行过程中的策略提出了评价函数,最后利用深度神经网络对状态/行为价值 (Q 值) 进行迭代逼近,求解 Bellman 最优方程,从而得到生产数量的最大化的最优解.
其他文献
今天的音乐教育,作为素质教育的有机构成部分,被摆在了更为重要的位置。教育能力是与成功的完整教育活动相联系的,它要求教师不仅具有过硬的专业理论知识和技能,还要具有评鉴
最近,我走访了省、市在响水扶贫的一些单位,调查了县内一些贫困乡、村,对如何进一步搞好扶贫工作,提高扶贫工作效益,形成了几点想法。我认为,扶贫工作要处理好三个关系。一
目的比较超声产前筛查辅助生殖技术受孕双胎与自然受孕双胎的胎儿及孕妇健康状况的效果。方法回顾性分析2010年5月-2015年5月在医院定期进行超声产前诊断后分娩的118例辅助生
1995年经济形势及其走势霍丽骊(国家计委国民经济综合司预测处处长)1995年国民经济运行的主要情况是:固定资产投资的过快增长得到遏制,但投资需求扩张的内在冲动强劲。1-11月,全国国有单位固定
音乐实践离不开创作、表演和欣赏三个重要环节,缺少任何一环节,都无法构成真正意义上的音乐。一部完整的音乐史,不仅应包括传统意义上的音乐创作史,还应将表演史和欣赏史纳入
本文基于环境温度给定的条件,对高温环境下热量由热防护服传递至人体皮肤的非稳态导热模型进行研究.本文建立无内热源、常物性、一维热传导偏微分方程,为确定定解条件,通过集
无论在什么岗位,从事何种工作,都要坚持狠抓思想政治工作不放松。供水公司隶属大港油田公司,历经40余年的发展历程,是一个集原水处理、污水处理及净化材料加工的企业。2011年
医院住院部药品金额管理的探讨北京首都医科大学附属安贞医院(100029)季文涓医院住院病人用药的金额管理,一直是个有待完善的问题。就北京市市属医院而言,基本分为两种计价方法:一种用处
目的探讨2006—2007年绍兴市居民主要死因。方法采用ICD-10统计分类方法,对2006—2007年绍兴市3个县(市、区)常住户籍人口全部死亡者进行分析。结果2006—2007年3县(市、区)
在森林或海边的一个角落,有许多人谈论着关于音乐与爱情的事情。他们都是长长的头发,忧伤的双眼和赤裸的灵魂。他们没有什么知识,甚至有些人得了感冒就会去抽大麻。他们是欢