论文部分内容阅读
本课题以一类连续时间非线性系统为被控对象,主要采用自适应动态规划方法(Adaptive Dynamic Programming, ADP),提出近似最优控制问题的解决方案。主要工作包括以下三个方面:
1、针对一类非仿射型非线性系统,提出了基于事件触发的输出反馈近似最优控制策略。在系统状态不完全可测的情况下,设计神经网络观测器,重构了系统内部状态。在估计状态信号基础上,利用ADP方法,设计输出反馈ADP控制策略。控制输入信号与系统输出信号构成事件触发条件的阈值,系统的控制输入信号和观测器神经网络权值更新取决于事件触发条件。相比于传统的时间驱动ADP控制策略,所提出的控制策略减少传输和计算负荷。最后,利用Lyapunov函数证明系统的所有信号是最终一致有界的(Uniformly Ultimately Bounded, UUB)。
2、针对一类非仿射型多输入多输出(Multiple Input Multiple Output, MIMO)非线性系统,设计了基于触发控制输入信号的输出反馈自适应近似最优跟踪控制策略。首先,设计模糊状态观测器得到系统状态向量的估计值,其中采用模糊逻辑系统(Fuzzy Logic System, FLS)近似系统的未知非线性函数。接着,在事件触发和反步控制的框架中,提出一种输出反馈控制策略,其包括自适应反步控制和基于ADP方法的近似最优控制,可以保证系统的性能指标近似最小。系统的控制输入信号采用固定阈值的事件触发条件,减少执行器更新次数。最后,利用Lyapunov函数分析系统的稳定性,并证明闭环系统的所有信号都是UUB。
3、针对一类含有输出限制的仿射型非线性多智能体系统,提出了状态一致协同ADP控制策略。在误差转换技术的基础上,利用非线性映射函数将原跟随者和领导者状态模型等价转换成新的仿射型非线性状态方程形式。借助非线性映射函数单调递增特性,原含有输出限制的多智能体系统状态一致协同ADP控制问题等价转化成转换后系统的状态一致协同近似最优控制问题。接着,设计神经网络观测器估计出新系统的状态向量。结合图论知识和ADP方法设计状态一致协同控制策略,并保证转换后系统的性能指标达到近似最优。最后,利用Lyapunov函数分析系统的稳定性,得到多智能体系统的状态达到一致,跟随者的输出信号满足限制条件,同时闭环系统是协同最终一致有界的(Cooperative Uniformly Ultimately Bounded, CUUB)。
1、针对一类非仿射型非线性系统,提出了基于事件触发的输出反馈近似最优控制策略。在系统状态不完全可测的情况下,设计神经网络观测器,重构了系统内部状态。在估计状态信号基础上,利用ADP方法,设计输出反馈ADP控制策略。控制输入信号与系统输出信号构成事件触发条件的阈值,系统的控制输入信号和观测器神经网络权值更新取决于事件触发条件。相比于传统的时间驱动ADP控制策略,所提出的控制策略减少传输和计算负荷。最后,利用Lyapunov函数证明系统的所有信号是最终一致有界的(Uniformly Ultimately Bounded, UUB)。
2、针对一类非仿射型多输入多输出(Multiple Input Multiple Output, MIMO)非线性系统,设计了基于触发控制输入信号的输出反馈自适应近似最优跟踪控制策略。首先,设计模糊状态观测器得到系统状态向量的估计值,其中采用模糊逻辑系统(Fuzzy Logic System, FLS)近似系统的未知非线性函数。接着,在事件触发和反步控制的框架中,提出一种输出反馈控制策略,其包括自适应反步控制和基于ADP方法的近似最优控制,可以保证系统的性能指标近似最小。系统的控制输入信号采用固定阈值的事件触发条件,减少执行器更新次数。最后,利用Lyapunov函数分析系统的稳定性,并证明闭环系统的所有信号都是UUB。
3、针对一类含有输出限制的仿射型非线性多智能体系统,提出了状态一致协同ADP控制策略。在误差转换技术的基础上,利用非线性映射函数将原跟随者和领导者状态模型等价转换成新的仿射型非线性状态方程形式。借助非线性映射函数单调递增特性,原含有输出限制的多智能体系统状态一致协同ADP控制问题等价转化成转换后系统的状态一致协同近似最优控制问题。接着,设计神经网络观测器估计出新系统的状态向量。结合图论知识和ADP方法设计状态一致协同控制策略,并保证转换后系统的性能指标达到近似最优。最后,利用Lyapunov函数分析系统的稳定性,得到多智能体系统的状态达到一致,跟随者的输出信号满足限制条件,同时闭环系统是协同最终一致有界的(Cooperative Uniformly Ultimately Bounded, CUUB)。