论文部分内容阅读
非线性系统的最优控制一直是控制领域研究的热点和难点之一.而传统的基于数学模型的最优控制在面对模型不确定的复杂动态系统时常难达到预期的性能指标,因此,采用基于数据的控制理论来解决复杂被控系统的在线预测、优化和控制,已成为智能控制领域的研究热点之一.而融合神经网络、评价设计以及经典动态规划的自适应动态规划方法为解决非线性控制问题尤其是基于数据的控制问题时提供了一个新的切入点.为此,本文在横向项目“甲醇生产过程平行控制系统的人工系统研发”的基础上以及国家自然科学基金项目“基于数据的智能电网电能供需自适应优化匹配与调控(61273140)”和“基于数据的非线性控制系统分析与设计(61034002)”等的资助下,针对一类带有未知死区约束控制的非线性离散仿射系统,基于自适应动态规划思想和自适应最优控制原理以及神经网络智能控制方法研究了该类系统的基于数据的最优控制问题.本文的主要工作和贡献主要体现在以下三个方面:
1.研究带有未知死区约束的离散时间仿射非线性系统的最优控制问题.现有的最优控制律设计人多是基于线性系统或基于饱和约束,而实际生活中死区约束控制输入严重影响了被控系统的动态性能,现有的基于死区约束控制律的设计,大都只关注稳定以及平滑的控制律设计.因此研究基于死区约束的非线性自适应最优控制具有重要的意义.而在研究非线性自适应最优控制问题时,最终需要求解离散时间哈密顿—雅克比—贝尔曼方程(DTHJB).所以我们首先将带有死区约束的自适应最优控制问题转化为求解DTHJB方程的解的问题,而该方程的解析解是很难获得的.我们引入迭代自适应动态规划(ADP)算法间接逼近DTHJB方程的最优解.而现有的迭代ADP算法中的HDP技术具有结构简单、容易实现等优点,因此我们首先利用HDP技术研究了带有未知死区的非线性系统自适应最优控制问题,在文中我们同时证明了DTHJB方程解的存在性以及唯一性,并证明了该解就是非线性最优控制问题的最优代价函数,而其相应的控制律就是最优控制律.
2.首次应用全局二次启发式规划(Globalized Dual Heuristic Programming,GDHP)算法研究带有未知死区约束的非线性自适应最优控制。虽然启发式动态规划(Heuristic Dynamic Programming,HDP)技术具有结构简单、容易实现等优点,但是精度较低,误差较大.而二次启发式规划(Dual Heuristic Programming,DHP)技术能够减少计算误差,但实现结构比较复杂,而且不能直接输出我们最需要的代价函数.采用GDHP技术可以同时克服上述两种方法的缺点又能融合这两种方法的优点.因此,本部分着重利用GDHP技术研究基于未知死区控制约束的非线性自适应最优控制,给出了基于死区约束控制的迭代GDHP算法,同时使用三层误差反向传播(Back Propagation,BP)神经网络构建了模型网络、评价网络以及执行网络,模型网络的构建使得基于数据驱动的控制成为可能,最后通过仿真实例验证了该算法的可行性.
3.首次利用径向基函数(Radial Basis Function,RBF)神经网络研究基于贪婪HDP迭代技术的自适应最优控制问题.提出针对带有死区约束的非线性最优控制问题的贪婪HDP迭代算法,然后首次采用RBF神经网络分别构建了模型网络、评价网络和执行网络以近似未知被控系统、代价函数以及相应的控制律,并通过典型的仿真实例验证了该算法的有效性及其优越性.