论文部分内容阅读
近年来,多智能体一致性问题作为人工智能领域的前沿研究热点,同时也作为多智能体系统协作控制中重要的研究基础,受到来自于各学科领域研究人员的持续关注。传统多智能体一致性协议中,智能体的状态变化一般通过当前自身以及通讯范围内邻居状态的组合计算得出,与智能体历史状态无关。然而对于智能体而言,由于其通讯范围有限,历史的状态信息对其仍具有一定的参考意义。另一方面随着嵌入式计算机计算性能的提升以及半导体芯片成本的降低,智能体个体有能力处理更多的状态信息。智能体通过对历史状态的回溯有助于提升自身学习和推理能力,使智能体能够根据历史状态计算得知自身及周边邻域智能体的运动趋势,从而对下一步的运动状态做更符合目标期望的决策,使其更加智能化,能够有效的提升多智能体一致性协议的收敛速度和鲁棒性。本文以多智能体聚集作为多智能体一致性的收敛目标,研究了离散时间下基于状态回溯的多智能体一致性协议,主要研究内容和成果如下:(1)设计了基于回溯状态预测的多智能体的一致性协议。以添加虚拟邻居的方式对智能体产生状态增益,其中虚拟邻居的选取采用智能体对自身历史状态回溯的方式,预测下一步的位置状态,将其选取为虚拟邻居。进一步的,通过对通讯范围内邻居智能体状态的回溯,判断与邻居智能体之间的运动趋势,根据运动趋势的差值选择更合适的虚拟邻居作为状态增益,以加快多智能体一致性协议的收敛速度。此外,通过额外的控制输入增强多智能体的拓扑连通性。(2)设计了基于回溯状态动态约束的多智能体一致性协议。多智能体网络拓扑的连通性是多智能体状态一致性收敛的重要前提,通过对多智能体自身及通讯范围内邻居智能体状态的回溯,判断智能体相比于邻居历史状态的运动趋势,从而评估智能体的连通质量。针对连通质量较差的智能体,有针对性的采用动态约束降低采样步长的方式,保持多智能体网络拓扑连通性,提升多智能体一致性协议鲁棒性。(3)设计了基于回溯状态调整邻域的多智能体一致性协议。实验发现智能体通讯连接数量过多时不一定能促进多智能体一致性协议的收敛,因此同样采用通过历史状态的回溯评估多智能体连通质量,针对连通质量较差的智能体使用拍卖算法降低其通讯连接数量以提升智能体拓扑连通质量,使智能体状态能够渐进收敛一致。