论文部分内容阅读
最优化方法是实现多智能体系统协调运行的有效方法;最优状态反馈控制器的存在性、运行约束非凸及目标函数非凸时优化策略的设计均为研究难点。本文从能控性经典引理出发,获得了有向树拓扑和简约树拓扑下二阶积分器和一阶积分器多智能体系统的能控性充要条件;从而保证了最优状态反馈控制器的存在性。通过信息融合技术及启发式的控制器设计思想,实现包含非线性测量及非凸运行约束、非凸目标函数的多智能体系统最优策略设计。当智能体模型包含连续状态及离散运行模式,且运行约束非凸时,设计实现了可收敛的分布式优化策略。 本研究主要内容包括:⑴对线性系统模型无约束多智能体系统的最优控制而言,最优状态反馈控制器的存在性取决于多智能体系统是否能控。已有研究所获得的代数及图论能控性条件均不够直观,且较难验证;本文着重分析有向图拓扑的能控性,特别是针对有向树和简约树拓扑,获得了一组较直观、较易验证的代数充要条件。特别地,针对一阶积分器多智能体系统,设计了一组分布式算法,使多智能体系统协作验证其能控性。⑵针对线性随机系统模型、非凸目标函数、非凸约束下的多智能体系统优化问题,由于其缺乏闭环解析形式的解,因此分析追,逃博弈这一特殊的系统,以提供根据特定目标实现优化策略的思路。通过粒子滤波,融合智能体的线性随机系统模型和非线性测量模型,实现相互之间的状态估计;通过类似三角定位的思想,由追捕者协作估计入侵者状态。引入了入侵者安全集的概念,追捕者多智能体系统的优化策略设计为以梯度法最小化入侵者安全集。在快速推进法的基础上,协作计算入侵者安全集,从而实现分布式化。与直接追捕策略进行了对比仿真,显示出本文所提策略的有效性。⑶当智能体为混杂系统模型,具有复杂的非凸运行约束,且策略集离散时,多智能体系统最优策略的实现往往依赖于求解组合优化问题,因此具有极高的计算复杂度甚至因维数爆炸问题而无法求解。本文提出一种分布式最优策略的设计思想,首先将原始问题解耦成一系列可被单个智能体通过动态规划方法求解的子问题;基于潜在博弈理论,通过迭代方式获得了可收敛的局部最优解。通过分析智能电网需求侧管理的实际应用案例,显示出本文所提方法的有效性。