论文部分内容阅读
随着现代网络控制系统的规模化和复杂化以及现代通信技术的飞速发展,由于传统集中式优化依赖于单个控制中心收集整个网络系统信息,因而很难适应复杂大规模系统高效、灵活、低成本以及安全隐私运行的需求。鉴于此,基于多智能体网络的分布式优化应运而生。近年来,分布式优化在无线传感器网络、电网系统、资源配置网络、多机器人系统、机器学习等众多领域中都有着广泛的应用,因此吸引了越来越多学者的研究和关注。论文以代数图论、凸优化理论、多智能体协同控制理论为基础,研究了网络化多智能体系统框架下的分布式(在线)约束优化问题。由于实际系统优化决策变量通常受到各种外在和内在因素的约束,因此相对于无约束优化问题,约束优化问题更一般更复杂,也更具有实际研究意义。论文围绕多智能体网络的分布式约束优化和分布式在线约束优化问题展开研究,其主要工作和贡献体现在以下几个方面:
1.研究了多智能体耦合等式约束下的光滑分布式约束优化问题。针对不同的通信拓扑,分别提出了三种基于交替方向乘子法(ADMM)的分布式约束优化算法。首先,在固定(时变)无向通信拓扑条件下,利用无中心(center-free)算法和ADMM算法解决了具有非二次局部目标函数和局部不等式约束的优化问题。在固定(时变)无向图为连通(联合连通)图时,严格证明了算法的收敛性以及收敛终值的最优性。接着,在固定非平衡有向图下,利用ADMM算法,Newton-Raphson方法,比例一致性算法,研究了多智能体耦合等式约束下光滑分布式约束优化问题。进一步考虑具有通信时延和通信丢包的有向通信拓扑,给出一种鲁棒优化算法。在有向图为强连通图并且对应的邻接矩阵为列随机矩阵的条件下,严格证明了这两种算法的收敛性以及收敛结果的最优性。
2.研究了多智能体耦合等式约束下的非光滑分布式约束优化问题。针对不同的初始条件、凸性条件、以及网络连通性条件,分别提出了三种连续时间分布式约束优化算法。首先,在固定无向图条件下,利用非光滑分析、微分包含理论以及代数图论解决了具有非光滑、一般凸而非严格凸局部目标函数的优化问题。算法给出的收敛结果依赖于特定的初始条件。因此,进一步给出了全分布式无初始化算法。通过引入辅助变量,消除了算法结果对特定初始条件的依赖性。同时,该算法不需要执行任何额外的初始化程序,节省了计算和通信成本,提升了算法应用的灵活性。最后,对有向平衡图下具有非光滑强凸局部目标函数的优化问题,给出了分布式求解算法并证明了算法的收敛性。
3.研究了多智能体耦合不等式约束下的分布式约束优化问题。针对不同通信拓扑条件,提出了两种分布式约束优化算法。首先,针对固定非平衡有向通信图下具有耦合不等式约束和局部集合约束的优化问题,基于投影的原始对偶次梯度法和一致性策略,提出了一种离散时间优化算法。当通信图为具有行随机邻接矩阵的强连通图并且算法步长满足给定条件时,利用该算法可渐近求得最优解。其次,针对时变非平衡有向图下的优化问题,基于push-sum策略和原始对偶次梯度法提出了一种连续时间优化算法,它可以解决时变的非平衡有向图下的优化问题。当通信图为联合强连通图时,证明了这类算法可渐近求得最优解。
4.研究了多智能体集合约束下的分布式在线约束优化问题。针对具有行随机邻接矩阵的非平衡有向图下的这类问题,根据目标函数的梯度信息是否已知,设计了两种分布式在线约束优化算法。当局部目标函数的梯度信息未知时,基于Kiefer-Wolfowitz算法的思想构造了随机差分估计器。同时,采用动态regret来分析和度量这两种在线优化算法的收敛性能。理论分析表明,当基准序列偏差的增长速度在一定范围内时,提出的这两种在线算法的动态regret上界相对于学习时间呈次线性增长。
1.研究了多智能体耦合等式约束下的光滑分布式约束优化问题。针对不同的通信拓扑,分别提出了三种基于交替方向乘子法(ADMM)的分布式约束优化算法。首先,在固定(时变)无向通信拓扑条件下,利用无中心(center-free)算法和ADMM算法解决了具有非二次局部目标函数和局部不等式约束的优化问题。在固定(时变)无向图为连通(联合连通)图时,严格证明了算法的收敛性以及收敛终值的最优性。接着,在固定非平衡有向图下,利用ADMM算法,Newton-Raphson方法,比例一致性算法,研究了多智能体耦合等式约束下光滑分布式约束优化问题。进一步考虑具有通信时延和通信丢包的有向通信拓扑,给出一种鲁棒优化算法。在有向图为强连通图并且对应的邻接矩阵为列随机矩阵的条件下,严格证明了这两种算法的收敛性以及收敛结果的最优性。
2.研究了多智能体耦合等式约束下的非光滑分布式约束优化问题。针对不同的初始条件、凸性条件、以及网络连通性条件,分别提出了三种连续时间分布式约束优化算法。首先,在固定无向图条件下,利用非光滑分析、微分包含理论以及代数图论解决了具有非光滑、一般凸而非严格凸局部目标函数的优化问题。算法给出的收敛结果依赖于特定的初始条件。因此,进一步给出了全分布式无初始化算法。通过引入辅助变量,消除了算法结果对特定初始条件的依赖性。同时,该算法不需要执行任何额外的初始化程序,节省了计算和通信成本,提升了算法应用的灵活性。最后,对有向平衡图下具有非光滑强凸局部目标函数的优化问题,给出了分布式求解算法并证明了算法的收敛性。
3.研究了多智能体耦合不等式约束下的分布式约束优化问题。针对不同通信拓扑条件,提出了两种分布式约束优化算法。首先,针对固定非平衡有向通信图下具有耦合不等式约束和局部集合约束的优化问题,基于投影的原始对偶次梯度法和一致性策略,提出了一种离散时间优化算法。当通信图为具有行随机邻接矩阵的强连通图并且算法步长满足给定条件时,利用该算法可渐近求得最优解。其次,针对时变非平衡有向图下的优化问题,基于push-sum策略和原始对偶次梯度法提出了一种连续时间优化算法,它可以解决时变的非平衡有向图下的优化问题。当通信图为联合强连通图时,证明了这类算法可渐近求得最优解。
4.研究了多智能体集合约束下的分布式在线约束优化问题。针对具有行随机邻接矩阵的非平衡有向图下的这类问题,根据目标函数的梯度信息是否已知,设计了两种分布式在线约束优化算法。当局部目标函数的梯度信息未知时,基于Kiefer-Wolfowitz算法的思想构造了随机差分估计器。同时,采用动态regret来分析和度量这两种在线优化算法的收敛性能。理论分析表明,当基准序列偏差的增长速度在一定范围内时,提出的这两种在线算法的动态regret上界相对于学习时间呈次线性增长。