论文部分内容阅读
针对路网中交叉口之间交通流的关联性、动态性及不确定性,应用了信号博弈作为交叉口交通信号控制agent(TSCA)间协调的模型,以分布式Q强化学习中Q值更新来进行其效用函数的学习,通过引入记忆因子对奖惩函数进行设计,及相邻交叉口之间的影响建立权值函数,构建了协调学习的仿真实现流程,并通过实验仿真验证此模型的有效性.