基于多智能体强化学习的公交信号优先控制方法研究

来源 :同济大学 | 被引量 : 0次 | 上传用户:lijiquan_555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
公交作为城市可持续、绿色发展的主要运载工具,是缓解交通拥堵最有效的措施之一。在洛杉矶、新加坡、杭州等城市的应用表明,公交信号优先是改善混合路权下公交车辆和社会车辆竞争关系的主要思路。随着大城市道路交通数字化和信息化的发展,智能公交信号优先控制系统应运而生。鉴于此,论文针对交通干线,利用智能控制技术展开公交信号优先控制策略的研究,论文主要研究内容包含如下三点:
  第一,公交信号优先基本理论、优先策略和应用模式综述。接着,分别从多目标优化控制、控制方法和检测技术三个方面描述了公交信号优先控制方法的研究现状,指出强化学习方法在公交信号优先控制系统中的发展方向和定位。
  第二,主动式公交信号优先配时策略的优化设计。在传统主动优先控制策略基础上,分析公交运行时空轨迹,并针对公交运行状态的差异性和社会车辆的运行需求设计优化策略;从控制节点、信号调整幅度等细化信号优先策略的作用范围;考虑不同模式交通的综合效益,设计了基于公交车辆运行状态和社会车辆延误程度的判断规则,实现了有条件优先感应控制的逻辑流程;采用VISSIM交通仿真软件,以真实路网为原型搭建仿真实验平台,针对模型驾驶员驾驶行为差异问题对模型进行校正;依据车辆感应编程VAP模块,模拟2种交通运行场景,验证文章中机理分析的正确性和控制逻辑的有效性。
  第三,基于多智能体强化学习公交优先自适应控制策略研究。基于公交实时优先控制思想,将路口每个交通控制器抽象为异质的智能体,采用强化学习理论构建干线多智能体强化学习控制的数学分析框架,明确定义基于状态合作的多交叉口交通信号控制的协调机制;设计智能体的交通状态、信号动作和回报函数等基础组成要素;进而提出基于强化学习合作机制的公交信号优先协调控制流程。依据.Net接口技术,采用C#语言编写外接控制程序与VISSIM仿真软件相连,搭建了基于VISSIM_COM的仿真实验平台,将真实路网模型与各类控制算法编写程序接入仿真实验平台。设计有针对性的实验场景和实验内容,对比分析定时控制、有条件优先感应控制和邻近状态合作的多智能体强化学习控制效果。
其他文献
为设计开发具有优异耐热迁移性能的分散染料,向染料分子中引入共平面结构被证实是有效方法之一。靛吩咛是一种以醌式噻吩结构为母体、吲哚-2-酮结构为端基的醌式杂环化合物,其共轭平面上的所有原子均处于同一平面上,具有较强的平面刚性,且在可见光区具有较高的摩尔消光系数。本文设计合成了以靛吩咛结构为母体的疏水性染料,并将其应用于涤纶织物染色,研究了靛吩咛染料分子共平面性与染料分散性能、染色性能等应用性能之间的
靛蓝染料在传统水浴染色过程中对棉纤维的上染率低,若想获得较高的染色深度,不但要对棉纤维进行多次染色,而且在染色过程中靛蓝隐色体极易被氧化,往往会耗费大量的碱剂、还原剂和水,造成染液废水的碱性大、染色工艺繁琐、染色成本增加等问题,靛蓝染料对棉纤维的传统染色工艺技术已经不能适应当代染色工艺发展的需求。怎样控制和减少纺织行业用水、有毒化学品以及染整助剂的使用,减少印染废水的排放,真正实现纺织行业的绿色环
学位
TiO2等无机纳米粒子具有优良的紫外屏蔽、抗菌除臭、净化空气、促进人体血液循环等功能,因而可广泛应用于纺织品的功能性整理。但这些纳米粒子在织物表面易团聚、难分散,与织物基体结合牢度差,这些问题的存在严重影响了纳米粒子功能和效应的充分发挥。本研究以TiO2粒子水分散液为无机粒子原料,通过原位乳液聚合制备得到了接枝率可控的聚丙烯酸酯PBA/TiO2复合乳胶,再以这种接枝复合乳胶为功能整理剂,应用于棉织
学位
随着对可再生资源利用的重视,利用木质素得到较高得率的酚类物质一直是木质素利用研究的热点之一,但是,利用热解或者氢解都无法得到单一的较高得率的酚类物质,通过氧化降解的方法能够使木质素降解才能得到较高得率的对羟基苯甲醛、香草醛以及紫丁香醛。其中木质素的湿法催化氧化转法,是将木质素氧化为芳香醛最有工业应用前景的方法,因而木质素的湿法氧化转化为芳香醛的反应中的较高活性的催化剂对木质素的湿法催化氧化有着重要
随着经济和工业化的高速发展、城市化进程的加速和人民生活水平的提高,城市水污染问题日益突出,尤其是其中的氮污染。氮是引起水体富营养化的主要因素,若处理不当,氦可转化为亚硝酸盐这一“三致”物质,严重威胁人类健康。因此,必须对污水进行脱氮,其中具有脱氮功能的硝化反硝化处理工艺被公认为是一种经济、有效、最有发展前途的污水脱氮方法之一,越来越受到环境研究者的青睐。N2O是硝化过程的副产物和反硝化过程的中间产
沥青路面由于受到车辆荷载和自然环境作用,经常出现沉陷、拥包、坑槽等病害,不仅降低路面使用性能、影响行车舒适性,严重时还会导致交通事故。对于这些路面病害,现有的人工检测、视频检测、振动检测及单点激光检测等手段存在效率低、精度低、检测范围小等不足,无法获取病害有效的三维空间特征,难以为精细化养护工作提供精确完整的病害信息。车载LiDAR(LightDetectionAndRanging,激光探测与测量
学位
为保障道路的路面性能,需面向道路网络定期开展路面养护工作。由于城市道路网络规模庞大,且道路养护预算规模有限,需要可靠的路面网级养护策略优化方法,在受限的养护预算下提出有效的路网养护策略。  目前,国内外已形成了一些路面网级养护策略优化模型,并成功应用于道路管理领域。然而,已有的研究成果多面向公路系统,少有模型适用于城市道路网络路面养护问题。同时,这些方法未考虑道路养护过程中对交通的负面影响,模型难
学位
随着我国交通事业的发展,公路、铁路隧道大量出现。一些隧道工程的修建常会穿越断层破碎带、饱和松软围岩、充填岩溶洞穴、侵入岩接触破碎带等特殊致灾地质体,即碎屑流地层。一旦处理不当,就会引发前方碎屑流地层泥水混合物突然大规模涌出,导致碎屑流灾害。本文以怀邵衡铁路拱桥铺隧道为研究工程背景,通过理论分析、数值模拟、室内试验、现场测试等方法,对碎屑流地层隧道开挖稳定性及变形控制技术进行了研究,取得了以下主要成
学位
地铁列车噪声问题日益受到关注,国内外已建立针对轨道车辆噪声相关的标准要求,对车内噪声进行预测分析和提出噪声优化方案在地铁设计阶段是至关重要的。本文利用有限元法和统计能量法对某地铁列车车内全频段噪声进行仿真预测,并与试验测试结果进行对比,最后针对铝型材板件进行隔声量仿真预测和优化设计。  首先针对地铁车内的低频噪声,建立车体结构-声腔耦合有限元模型,以车辆动力学模型计算出的空簧处激励力作为输入,计算
学位
ZPW-2000A无绝缘轨道电路作为应用广泛的区间轨道区段的关键信号设备,担负着检查进路轨道区段状态、检查钢轨的完整性以及车地信息传输的关键任务,其工作状态直接影响列车运输效率和列车运行安全。但是由于有限的轨道电路监测条件以及“故障修”的维修现状,行车事故常有发生。鉴于此,从轨道电路的工作原理以及集中监测系统的采集原理出发,以轨道电路故障智能化检测和预警为目的,研究在集中监测数据驱动下的故障智能预
学位