基于多智能体网络的分布式(在线)约束优化算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:sksliuxin6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代网络控制系统的规模化和复杂化以及现代通信技术的飞速发展,由于传统集中式优化依赖于单个控制中心收集整个网络系统信息,因而很难适应复杂大规模系统高效、灵活、低成本以及安全隐私运行的需求。鉴于此,基于多智能体网络的分布式优化应运而生。近年来,分布式优化在无线传感器网络、电网系统、资源配置网络、多机器人系统、机器学习等众多领域中都有着广泛的应用,因此吸引了越来越多学者的研究和关注。论文以代数图论、凸优化理论、多智能体协同控制理论为基础,研究了网络化多智能体系统框架下的分布式(在线)约束优化问题。由于实际系统优化决策变量通常受到各种外在和内在因素的约束,因此相对于无约束优化问题,约束优化问题更一般更复杂,也更具有实际研究意义。论文围绕多智能体网络的分布式约束优化和分布式在线约束优化问题展开研究,其主要工作和贡献体现在以下几个方面:
  1.研究了多智能体耦合等式约束下的光滑分布式约束优化问题。针对不同的通信拓扑,分别提出了三种基于交替方向乘子法(ADMM)的分布式约束优化算法。首先,在固定(时变)无向通信拓扑条件下,利用无中心(center-free)算法和ADMM算法解决了具有非二次局部目标函数和局部不等式约束的优化问题。在固定(时变)无向图为连通(联合连通)图时,严格证明了算法的收敛性以及收敛终值的最优性。接着,在固定非平衡有向图下,利用ADMM算法,Newton-Raphson方法,比例一致性算法,研究了多智能体耦合等式约束下光滑分布式约束优化问题。进一步考虑具有通信时延和通信丢包的有向通信拓扑,给出一种鲁棒优化算法。在有向图为强连通图并且对应的邻接矩阵为列随机矩阵的条件下,严格证明了这两种算法的收敛性以及收敛结果的最优性。
  2.研究了多智能体耦合等式约束下的非光滑分布式约束优化问题。针对不同的初始条件、凸性条件、以及网络连通性条件,分别提出了三种连续时间分布式约束优化算法。首先,在固定无向图条件下,利用非光滑分析、微分包含理论以及代数图论解决了具有非光滑、一般凸而非严格凸局部目标函数的优化问题。算法给出的收敛结果依赖于特定的初始条件。因此,进一步给出了全分布式无初始化算法。通过引入辅助变量,消除了算法结果对特定初始条件的依赖性。同时,该算法不需要执行任何额外的初始化程序,节省了计算和通信成本,提升了算法应用的灵活性。最后,对有向平衡图下具有非光滑强凸局部目标函数的优化问题,给出了分布式求解算法并证明了算法的收敛性。
  3.研究了多智能体耦合不等式约束下的分布式约束优化问题。针对不同通信拓扑条件,提出了两种分布式约束优化算法。首先,针对固定非平衡有向通信图下具有耦合不等式约束和局部集合约束的优化问题,基于投影的原始对偶次梯度法和一致性策略,提出了一种离散时间优化算法。当通信图为具有行随机邻接矩阵的强连通图并且算法步长满足给定条件时,利用该算法可渐近求得最优解。其次,针对时变非平衡有向图下的优化问题,基于push-sum策略和原始对偶次梯度法提出了一种连续时间优化算法,它可以解决时变的非平衡有向图下的优化问题。当通信图为联合强连通图时,证明了这类算法可渐近求得最优解。
  4.研究了多智能体集合约束下的分布式在线约束优化问题。针对具有行随机邻接矩阵的非平衡有向图下的这类问题,根据目标函数的梯度信息是否已知,设计了两种分布式在线约束优化算法。当局部目标函数的梯度信息未知时,基于Kiefer-Wolfowitz算法的思想构造了随机差分估计器。同时,采用动态regret来分析和度量这两种在线优化算法的收敛性能。理论分析表明,当基准序列偏差的增长速度在一定范围内时,提出的这两种在线算法的动态regret上界相对于学习时间呈次线性增长。
其他文献
学位
学位
学位
学位
跳频通信信号载波根据伪随机序列不断地进行跳变,与常规定频通信相比,其具有优秀的信号抗干扰、抗截获性能和多址组网能力。跳频通信技术广泛地应用在各种军事通信网络、局域网、传感器网络中,具有广阔的应用场景和实用价值。  论文针对一种突发模式下的宽带跳频通信系统,重点研究了宽带跳频收发信机中的基带信号处理技术,并在硬件平台实现了相应的收发基带模块,对网络节点组网起到了支撑作用。主要工作如下:  ①针对宽带
学位
骨龄评估对于青少年身体发育情况的评估有着重要意义,可以用来指导青少年合理运动和饮食。最常用的骨龄评估的临床方法是通过肉眼对比左手手骨和标准手图,来评定骨龄。这种方法是非常主观的,其准确度很大程度上取决于从业者的经验。因此,研究出一种高效、稳定和客观的评估骨龄的方法显得非常重要。  国内外研究学者很早就开展了对骨龄评估任务的自动化和计算机化的相关研究,其中卷积神经网络取得了最好的效果。但是,目前研究
随着计算机技术的发展和Internet的普及,Web和用户对Web访问的信息的爆炸式增长与人们注意力的有限性之间的矛盾也随之加剧,Web数据挖掘是解决这一矛盾的有效手段,但由于Web数据及应用的特殊性,使得传统的技术不能直接应用在Web的信息挖掘中.Web日志数据是记录用户对Web站点访问信息的数据,保存有大量的路径信息,对这类信息的分析有利于设计人员掌握用户访问Web的行为特征,并可以用来对网站
学位
电场耦合无线电能传输(Electric-field Coupled Wireless Power Transfer,EC-WPT)技术是一种以高频电场作为能量传输介质,并综合利用电力电子技术、电工理论和现代控制理论,实现无直接电气连接的电能传输技术。电场耦合机构一般由四块金属电极构成,其结构简易轻薄,成本低,形状易变;在工作状态中,电场耦合机构的绝大部分电通量分布于电极之间,对周围环境的电磁干扰很
非线性网络化系统,由于其设备简易、扩展方便、操控简单、贴近实际、易于维护、资源共享等特点在实际工程中得到了广泛应用。但随着网络化规模不断扩大,有限的网络带宽和传输通道使得数据传输过程不可避免地存在一些网络诱导问题,如时延、数据包丢失、和信号量化等,使得非线性网络化系统的控制问题变得更为复杂。这些网络诱导问题如果不加以干预,会影响系统的稳定性能,也增大了系统运行出错的可能性。目前相关问题研究仍不够充
最小相位(minimum phase,MP)特性在控制系统分析和设计中扮演着极其重要的角色。非最小相位(non-minimum phase,NMP)特性的存在极大的限制了控制系统能够达到的性能,导致一些控制算法无法直接应用。然而,一个具有最小相位(稳定)零点/零动态的连续时间MP系统经采样保持器离散化后,相应的离散时间系统可能变成一个NMP系统。NMP系统的控制比MP系统更加困难。  离散时间系统