基于神经网络的非线性系统控制自适应动态规划方法研究

来源 :中国科学院研究生院中国科学院大学 | 被引量 : 0次 | 上传用户：cz1502008

【摘要】

：

在控制理论研究和控制工程实践中,非线性系统的最优控制都是一个重要的主题.为了克服动态规划方法在求解此类问题中的不足,结合强化学习思想的自适应动态规划(Adaptive Dynam

【作者】

：

王鼎

【机构】

：

中国科学院大学

【出处】

：

中国科学院研究生院中国科学院大学

【发表日期】

：

2012年期

【关键词】

：

智能控制神经网络自适应动态规划非线性系统

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在控制理论研究和控制工程实践中,非线性系统的最优控制都是一个重要的主题.为了克服动态规划方法在求解此类问题中的不足,结合强化学习思想的自适应动态规划(Adaptive Dynamic Programming,ADP)方法逐渐成为控制科学特别是智能控制领域的研究热点之一.作为构建具有人脑智能行为的智能系统的重要方法,ADP有着广泛的应用前景.但是,它的方法体系还没有得到完善,利用ADP方法研究非线性系统最优控制的许多理论与技术问题还有待解决.为此,在国家自然科学基金重点项目“基于数据的非线性控制系统分析与设计(61034002)”等的资助下,本项课题基于ADP方法进一步研究非线性离散系统的最优控制问题,提出适合不同情形的迭代ADP算法,逐步扩展ADP方法的使用范围.本文的主要工作和贡献体现在以下四个方面.　　 1.研究ADP方法的高级实现结构并用于求解未知非线性离散系统的最优控制问题.由于许多实际系统难以建立精确的数学模型,而且现有的实现结构不能同时达到计算误差小和直接输出代价函数的目标,本文首次提出采用全局二次启发式规划(Globalized Dual Heuristic Programming,GDHP)技术的迭代ADP算法并给出改进的收敛性证明方法,以此求解具有未知动态非线性系统的最优控制问题.此外,为了简化ADP方法的实现结构,本文同时研究只需要构造模型网络和评判网络的迭代ADP算法.仿真结果表明,这里提出的控制方案不仅能够成功地解决未知非线性系统的最优控制问题,而且可以获得令人满意的控制效果.　　 2.提出有限时间迭代ADP算法并求解非线性离散系统的有限时间最优跟踪控制问题.首先通过系统变换将跟踪控制问题转化为误差系统的调节器设计问题,然后引入有限时问迭代ADP算法并给出收敛性分析,由此得到的反馈控制能够保证代价函数在ε误差界内接近其最优值.最后分别采用启发式动态规划和二次启发式规划技术来实现算法,并通过仿真实例验证所提方法的可行性.　　 3.基于迭代GDHP算法设计具有控制约束非线性离散系统的最优控制策略.首先引入非二次型形式的代价函数来处理控制约束,然后基于迭代ADP算法设计最优反馈控制并进行相应的收敛性分析.在具体的算法实现过程中,分别构建模型网络、评判网络和执行网络以近似被控系统、代价函数及其偏导数和控制律.仿真结果显示本文提出的方法能够有效地克服控制约束现象.　　 4.利用迭代ADP算法研究具有未知动态非仿射非线性离散系统的最优控制.提出针对非仿射非线性情形的迭代ADP算法,将相关结论推广至实际中广泛存在的一般非线性系统,进而研究具有控制约束未知非仿射非线性离散系统的最优控制,并通过仿真实例验证迭代GDHP算法在求解此类问题中的优越性.

其他文献

微小井眼连续油管钻井单芯电缆随钻测量数据传输研究

连续油管钻井技术因其钻井工艺的高效性、灵活性、降低钻井成本、保护环境、应用范围广泛等特点,已逐渐成为石油钻井技术发展的新方向,展现出巨大的发展空间。论文依托的课题

学位

连续油管钻井随钻测量单芯电缆电力线载波微小井眼数据传输

基于主动轮廓的图像分割理论与方法研究

图像分割是计算机视觉中的核心问题之一，是图像分析和理解的基础。传统的数据驱动的分割方法由于自身的局限性，使其分割结果很难满足医学等复杂图像分割应用的需求。因此，迫切需

学位

图像分割方法主动轮廓水平集方法C-V模型

基于社团检测的大型网络可视化研究

近年来，复杂网络研究受到了不同学科研究人员的广泛关注，其发展极大的促进了人们对现实复杂网络系统的理解。复杂网络研究者普遍认为网络中存在社团结构，即整个网络是由若干个群

学位

可视化复杂网络社团骑墙节点层次化重叠社团

基于子空间和迁移学习的目标跟踪

目标跟踪在运动目标的视觉分析中占有重要的地位,属于视觉的中层部分。利用目标的跟踪,可以方便地获得目标的运动、姿态、行为参数,为后续高层的行为识别和理解奠定基础。目

学位

视觉监控目标跟踪子空间遮挡处理表观分块迁移学习

中速磁浮列车混合悬浮系统的电磁铁防吸死技术研究

学位

面向人眼探测识别的图像质量表征及优化方法研究

数字图像、视频日益成为人们日常生活中离不开的信息媒体。在数字图像的获取、处理、编码、。存储、传输和重建的每一个过程中,图像质量都可能出现变化。如何衡量系统获取、

学位

人眼探测识别图像质量表征软件实验平台优化方法

微博客中面向网络热点的信息挖掘应用研究

微博客作为一种新型的网络媒体,以其简洁方便的交互方式,受到越来越多网络用户喜爱。用户能够通过微博客平台实时地了解当前的社会热点,关注自己喜欢的主题,并针对这些内容发

学位

微博客网络热点主题关联信息挖掘内容浏览

生产计划与控制中DBR方法应用的关键问题研究

目前的市场环境以买方为主导，多品种小批量生产方式成为主流，在此背景下建立一个良好的符合企业实际情况的生产计划与控制体系，能够保障企业实施高效生产，快速响应客户需求，从而赢得竞争优势，使企业获得更多的收益。传统的生产计划与控制体系，以制造资源计划和准时制生产为代表，它们并不适于多品种小批量生产方式，约束理论的出现为解决上述情况开拓了一种新的思路，它是以同步生产为核心思想的一套管理理念和管理工具的集合

学位

DBR瓶颈缓冲批量排程

水泥生料立磨粉磨过程智能控制方法研究与应用

生料粉磨是水泥生产过程中的重要环节,也是耗能较多的环节。生料粉磨系统运行的稳定性和运行效率直接影响到整个水泥生产过程的生产能力、能耗等各项经济指标。立式辊磨机(简

学位

智能控制方法工况识别故障诊断水泥生料粉磨系统

工业无线网络部署问题与抗干扰技术研究

工业无线网络是具体针对工业应用的无线传感器网络。本文研究了其在应用中所面临的两种挑战:一是在网络部署中,由于节点位置受到待监测设备位置的限制,节点分布呈现不均衡的

学位

工业无线网络中继节点部署抗干扰技术频率切换拓扑结构

基于神经网络的非线性系统控制自适应动态规划方法研究

其他学术论文