基于神经网络的非线性系统自适应最优控制研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:zhoushucheng0533
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
非线性系统的最优控制一直是控制领域研究的热点和难点之一.而传统的基于数学模型的最优控制在面对模型不确定的复杂动态系统时常难达到预期的性能指标,因此,采用基于数据的控制理论来解决复杂被控系统的在线预测、优化和控制,已成为智能控制领域的研究热点之一.而融合神经网络、评价设计以及经典动态规划的自适应动态规划方法为解决非线性控制问题尤其是基于数据的控制问题时提供了一个新的切入点.为此,本文在横向项目“甲醇生产过程平行控制系统的人工系统研发”的基础上以及国家自然科学基金项目“基于数据的智能电网电能供需自适应优化匹配与调控(61273140)”和“基于数据的非线性控制系统分析与设计(61034002)”等的资助下,针对一类带有未知死区约束控制的非线性离散仿射系统,基于自适应动态规划思想和自适应最优控制原理以及神经网络智能控制方法研究了该类系统的基于数据的最优控制问题.本文的主要工作和贡献主要体现在以下三个方面:   1.研究带有未知死区约束的离散时间仿射非线性系统的最优控制问题.现有的最优控制律设计人多是基于线性系统或基于饱和约束,而实际生活中死区约束控制输入严重影响了被控系统的动态性能,现有的基于死区约束控制律的设计,大都只关注稳定以及平滑的控制律设计.因此研究基于死区约束的非线性自适应最优控制具有重要的意义.而在研究非线性自适应最优控制问题时,最终需要求解离散时间哈密顿—雅克比—贝尔曼方程(DTHJB).所以我们首先将带有死区约束的自适应最优控制问题转化为求解DTHJB方程的解的问题,而该方程的解析解是很难获得的.我们引入迭代自适应动态规划(ADP)算法间接逼近DTHJB方程的最优解.而现有的迭代ADP算法中的HDP技术具有结构简单、容易实现等优点,因此我们首先利用HDP技术研究了带有未知死区的非线性系统自适应最优控制问题,在文中我们同时证明了DTHJB方程解的存在性以及唯一性,并证明了该解就是非线性最优控制问题的最优代价函数,而其相应的控制律就是最优控制律.   2.首次应用全局二次启发式规划(Globalized Dual Heuristic Programming,GDHP)算法研究带有未知死区约束的非线性自适应最优控制。虽然启发式动态规划(Heuristic Dynamic Programming,HDP)技术具有结构简单、容易实现等优点,但是精度较低,误差较大.而二次启发式规划(Dual Heuristic Programming,DHP)技术能够减少计算误差,但实现结构比较复杂,而且不能直接输出我们最需要的代价函数.采用GDHP技术可以同时克服上述两种方法的缺点又能融合这两种方法的优点.因此,本部分着重利用GDHP技术研究基于未知死区控制约束的非线性自适应最优控制,给出了基于死区约束控制的迭代GDHP算法,同时使用三层误差反向传播(Back Propagation,BP)神经网络构建了模型网络、评价网络以及执行网络,模型网络的构建使得基于数据驱动的控制成为可能,最后通过仿真实例验证了该算法的可行性.   3.首次利用径向基函数(Radial Basis Function,RBF)神经网络研究基于贪婪HDP迭代技术的自适应最优控制问题.提出针对带有死区约束的非线性最优控制问题的贪婪HDP迭代算法,然后首次采用RBF神经网络分别构建了模型网络、评价网络和执行网络以近似未知被控系统、代价函数以及相应的控制律,并通过典型的仿真实例验证了该算法的有效性及其优越性.
其他文献
随着对钢材质量的要求越来越高,所以对钢水温度提出了更为严格的要求。如何更合理的对钢水温度进行控精确制,是一个迫切需要解决的课题。本文以LF炉精炼过程中钢水,炉衬,钢渣
随着微机电系统的发展,对微小零件装配提出了更高的要求。显微视觉引导下的微装配机器人为微小零件三维空间装配提供了有效解决方案。本论文针对显微视觉微装配关键技术展开研
随着摄像机视频监控的广泛应用,面对实时全天候摄入的海量视频监控数据,不仅需要对视频进行有效地组织和管理,还需要让计算机自动地理解视频内容并做出处理,实现智能化视频监控。
电容层析成像技术(Electrical Capacitance Tomography, ECT)是一种基于电容传感机理的过程成像技术。现阶段ECT技术的理论还不够完善,成像速度和成像精度的相互制约限制了EC
精馏塔是石油化工生产的核心装置。由于精馏塔的常规检测技术以及控制方法往往过于保守、能耗大,而软测量技术及先进控制方法能够弥补常规控制时控制效果不佳情况,而且适用于
该文建立了社会系统控制论模型,通过模型模型仿真证明了所提出的社会可持续性观 点的正确性与研究方法的可行性;同时还讨论了与社会系统结构特性有关的几个问题.主要包括以下
随着网络技术的快速发展与Web2.0的盛行,当前社会媒体呈现出新的特点:重视用户交互(如建立链接关系、添加标签等)、信息更新频繁、内容多样、拥有海量内容等。这些特点为用户获
本文设计并实现了以TMS320F2812DSP为数据处理核心的绝对式感应同步器测角系统,提出了实用和创新的方法对系统的误差进行了修正与补偿,取得了较为理想的效果。设计中注意使用性能出色、集成度高的元件,简化了系统结构,提高了稳定性和抗干扰性,实现了系统向一体化和小型化的迈进。感应同步器测角系统是一种精确测量角位移值、实时显示测量数据的数字化位置检测设备。本测角系统采用360对极绝对式圆感应同步器作
高速飞行器的发展是一个国家国防实力的重要体现,发达国家投入大量的人力和财力开展了高速飞行器的研究。飞行器进入大气层高速飞行的过程中,光学头罩与高速气流发生剧烈的相互
随着市场竞争日趋激烈,如何通过供应链成员企业之间的合作与协调来降低成本、提高客户服务水平和快速响应市场需求成为供应链管理研究的重点与热点。供应链的协同管理是供应链管理的核心内容,其中制造和交付的协同调度过程是供应链协同管理的一个重要的研究课题。本文针对带有时间约束的单机制造与运输交付协同调度问题进行研究。研究内容如下:(1)针对单机制造和多客户组成的两级供应链系统,考虑有容量限制单台运输车辆批量运