基于深度强化学习的信号交叉口智能控制方法研究

来源 :重庆交通大学 | 被引量 : 0次 | 上传用户:klwxm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
交通拥堵已经成为各大城市可持续发展路上的绊脚石,在当前道路资源和基础设施下,寻求更先进、智能的交通信号控制方法成为最近的流行趋势。得益于人工智能技术的飞速发展,交通信号控制方法也取得了巨大进步,然而现有研究中的交通信号控制方法通常仅考虑了交通流量、车道占有率等传统交通参数进行信号配时方案优化,没有充分利用交通状态的关键信息;另外,关于多个交叉口信号协调控制的研究也较少。因此,为了缓解交通拥堵和提高道路运输效率,同时提升交通信号控制的高效性和可靠性,本文将研究基于深度强化学习的信号交叉口智能控制方法。
  首先,本文总结分析了深度强化学习在交通信号控制的应用现状,在此基础上,搭建了一个用于信号交叉口智能控制实验的交通仿真平台。该平台以免费开源的微观交通仿真软件SUMO作为底层架构,并使用编程语言Python调用接口TraCI进行二次开发,同时采用OpenAI的Stable Baselines库作为实现深度强化学习算法的框架,进而从环境配置、平台架构和功能模块三方面完成了仿真平台的搭建,为后文的研究奠定了基础。
  其次,针对单路口智能信号控制,本文提出了一种基于改进深度Q学习的方法。该方法详细描述了单路口的交通环境,精确设计了信号智能体的三要素(状态定义为包含平均排队长度、车辆位置和车辆速度的集合,动作定义为每个周期时长内不同相位的绿灯持续时间,奖励定义为系统总延误时间);同时考虑到传统DQN模型的训练效率低下和Q值偏差问题,相应改进了模型架构和折扣系数,并在仿真平台上进行算法验证。通过不同交通条件下的仿真实验证明了所提方法的有效性和优越性。
  最后,针对多路口智能信号控制,本文提出了一种结合博弈论的深度强化学习信号控制方法。该方法在单路口基础上,通过引入博弈论,设计了一个包含IA-MADRL模式和CA-MADRL模式的智能体控制结构;IA-MADRL模式控制用于交通需求未饱和时,CA-MADRL模式控制用于交通需求饱和时,两者之间的切换由控制模式检测模块决定;采用的正则形式博弈有效协调了各交叉口的联合动作,加强了智能体之间的实时交互。通过不同交通需求下的仿真实验证明了所提方法的可靠性和科学性。
其他文献
随着我国社会经济的不断发展,机动车保有量的不断增加,城市路网中的交通拥堵问题日益突出。如何识别路网交通状态,合理地进行城市交通管控,是目前交通领域研究的热点之一。然而,路网交通状态识别的效果受到交通数据质量和识别方法精度的制约。因此,研究提高交通数据质量和交通状态识别效率的方法具有重要意义。本文主要工作内容如下:  首先,在分析交通数据获取方法特点的基础上,采用微波检测器数据和互联网平台数据作为交
学位
电子商务的蓬勃发展和城市化进程的不断加快,使得城市物流需求的增长与公共运输资源的紧张造成的交通拥堵问题日益凸显,同时城市居民对高质量生活的要求迫切需要一种高效快捷、负面影响较小的新型城市物流配送模式。为节约成本、减少城市物流对公共运输资源的占用和保护环境,提出利用卡车等地面运输车辆与地铁协同完成配送的物流模式,对配送过程进行优化,为配送实践提供理论依据。  卡车地铁协同配送过程中货物通过卡车收集后
学位
城市道路交叉口是道路交通网络中的重要节点,对道路网通行效率具有直接影响。相比于平原城市,山地城市道路交叉口由于地形条件限制存在坡度大、车道窄和弯、坡组合路段等特点,往往更容易发生车辆受阻或交通事故。为进一步明确车辆在山地城市道路交叉口的运行特性,本文以山地城市6个地形条件较复杂的平面交叉口为研究对象,基于无人机拍摄的高空视频,通过DataFromSky AI视频分析平台得到5000余条车辆运行速度
铁路综合客运枢纽是城市综合交通体系的重要组成部分,是实现各种运输方式高效衔接和一体化运输组织的关键节点。铁路综合客运枢纽通过衔接不同交通方式来保证铁路到达客流疏散到城市的每个角落。受干线铁路列车到达时刻的影响,铁路换乘客流呈现较强短时高聚集的特性,导致枢纽短时运输供需不匹配。当铁路客运枢纽各接驳方式不能匹配脉冲式铁路到达客流,将导致乘客滞留、错失搭乘等现象,降低换乘效率,延长等候时间,严重时危及乘
随着社会经济飞速发展,私家车拥有量持续上涨,给居民的出行方式带来了更加多样的选择。在这样的大环境下,中国大城市公交分担率持续下降。尤其是随着轨道交通的发展,传统的公交交通分担率下降更为明显。为了缓解城市交通拥堵响应低碳出行,发展公交优先是有效解决手段,截至2020年年底,中国公交专用道总里程将超过12000公里。而设置公交专用道会导致社会车辆车道数减少,社会车辆拥堵更加严重,与此同时公交专用道上存
轨道交通与常规公交是城市公共交通系统的重要组成部分,推动两者一体化发展有助于公共交通资源利用合理化、公共交通系统结构优化、居民出行高效化。在促进轨道交通与常规公交一体化发展过程中,现有研究多集中于两者的接驳,对共线这种情况的研究相对较少。然而常规公交与轨道交通共线情况下的协调发展是推进两者一体化发展的重要环节。因此,本文对该情况下公交线路及站点的优化进行探讨,主要对以下几方面进行了研究:  首先,
学位
随着中国城市建设的快速发展,城市机动车保有量持续增长,造成交通拥堵、空气污染、能源消耗等问题日益严重。为了从根本上解决城市交通发展过程中的一系列问题,跳出通过新建、拓宽道路等方式短暂解决部分区域表面交通拥堵问题的思维,优先发展载客容量大、低碳环保、出行成本低的公共交通的观念应运而生,由此各大城市研究或实施了大量公交优先的政策与措施,引导人们向公共交通出行转移。在众多政策与措施中,公交优先道因其见效
在国内社会经济高速发展以及城市规模持续扩张的背景下,居民汽车保有量也呈现出逐年上升的态势,城市拥挤现象频发,导致出行者在旅途过程中花费的时间过长,驾驶员提前根据路网历史交通状态对未来交通状态进行初步判断,然后对出行路径进行规划,且对出行路径选择往往追求尽可能短和可靠的沿途旅行时间,特别是对于警车、消防车或救护车等紧急车辆在执行任务时,需快速对时间紧迫的消防任务、医疗援助等做出反应,以确保应急响应效
学位
随着城市汽车保有量逐年激增,道路交通供需矛盾日益突出,导致交通拥堵问题愈加严重。交通路段静态属性特征和交通流特性的不同使得这些路段在整个路网中的作用和重要程度具有差异。某些路段在路网中起着关键作用,这些路段一旦失效(如发生事故、施工及堵塞等),会降低交通路网连通性并影响路网整体性能,甚至引起路网大面积交通拥堵。智能检测技术的发展以及在交通领域的广泛应用,产生了种类多样、数量庞大的交通数据,为城市路
学位
随着城市化进程的加快,道路交通流受到越来越多复杂因素的影响,并在时间、空间上随机性变化,对道路交通流状态进行准确的预测能为交通拥堵治理提供可靠的信息支持。智能检测技术的广泛应用使得城市交通系统产生越来越多的交通数据,综合利用这些海量数据可为分析、掌握交通状态的变化趋势提供更全面的信息。面对具有非线性、随机性、时空渐变性等特性的海量交通数据,传统的基于精确数学模型的数据处理方法存在条件过多、参数固定
学位