基于Q-learning的高速铁路列车动态调度方法

来源 :控制理论与应用 | 被引量 : 0次 | 上传用户:lzs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高速铁路作为国家综合交通运输体系的骨干核心,近十年来取得了飞速蓬勃的发展.其飞速发展的同时也引发了路网复杂化、分布区域广等现象,这些现象对高铁动态调度提出了更高的要求.突发事件的不确定性会对列车造成时间延误影响,甚者时间延误会沿路网传播,造成大面积列车到发晚点.而目前对于此问题的人工调度方式,前瞻性及针对性较差,难以对受影响列车进行迅速调整.针对上述问题,本文建立了以各列车在各车站延误时间总和最小为目标函数的高速铁路列车动态调度模型,在此基础上设计了用于与智能体交互的仿真环境,采用了强化学习中的Q-learning算法对模型进行求解.最后通过仿真实例验证了仿真环境的合理性以及Q-learning算法用于高铁动态调度的有效性,为高铁调度员做出优化决策提供了良好的依据.
其他文献
为贯彻落实新时代教育方针要求,培塑生长军官学员政治能力,提升军校人才培养质量,剖析了当前学员政治能力训练存在的主要问题,归纳了生长军官学员政治能力训练的内涵,提出了聚焦“四性”培塑学员政治能力,即从系统性、历史性、时代性、实践性4个维度分别训练新时代军校学员辨是非懂坚守、观大势明方向、看全局应变局、勇担当敢作为的政治能力.这可为军校加强生长军官学员政治能力训练提供理论依据.
针对一类线性连续时滞系统,提出一种最优预见重复控制设计方法.首先,通过一种等价变换,将被控时滞系统转化为无时滞系统.然后,利用L阶差分算子提升技巧,获得包含状态变量导数和跟踪误差的增广连续系统.在此基础上,通过定义一种新的性能指标,将预见重复控制设计问题转化为连续非自治系统的线性二次调节问题.进一步,基于最优控制理论,得到包含状态反馈、误差积分、重复控制、时滞补偿和预见补偿的最优预见重复控制器.该控制器包含了已有文献的多种控制器形式.最后,通过一个数值仿真实例,说明所提方法的有效性.
针对传统雷达装备教学的不足,构建了雷达专业智慧教室;根据雷达专业智慧教室的组成和特点,提出了多维多模混合式装备教学新形态;结合应用实例,给出了具体的教学实施过程.教学实践表明,利用雷达专业智慧教室开展多维多模混合式教学,可以达到线上线下结合、理实一体融合、虚拟现实互补、交流互动多样和学员主体地位突出的效果,从而显著提高装备教学效率和人才培养质量.
天问一号火星探测器成功实现了我国首次火星表面软着陆,进入舱制导导航与控制系统(GNC系统)负责在火星进入下降着陆过程实施进入舱的姿态与轨道控制,确保进入舱安全着陆火星表面.介绍了执行天问一号火星EDL任务的GNC系统飞行阶段划分、系统组成、方案架构,以及针对火星EDL任务的特色设计,最后介绍了GNC系统在轨飞行结果.
为实现我国首次月球样品无人采样返回任务,设计了嫦娥五号(Chang’E-5)探测器制导、导航与控制(GNC)系统.根据任务要求和探测器特点,GNC系统设计分为轨道器GNC子系统、返回器GNC子系统和着上组合体GNC子系统.给出了嫦娥五号探测器GNC系统的架构设计、工作模式以及在轨飞行结果.结果表明,GNC系统设计正确,成功完成了动力下降、起飞上升、交会对接、返回再入等关键动作,实现了月球表面起飞上
对X射线天文卫星观测需求进行了分析,提炼了观测任务对观测模式、源的高精度定位与对准、轨道、热控、测控数传等多项需求与约束;针对X射线观测的多需求、多约束难点,设计了集巡天观测、定点观测与小天区扫描观测于一体的观测模式,解决了一颗卫星同时实现全天扫描、银道面深度扫描、重要惯性区域扫描、重要及机遇目标深度观测以及伽马暴全天监测的多种观测需求的难题,该技术已在我国硬X射线调制望远镜卫星上得到应用.
为了规划合理的路径以规避行人,针对行人轨迹预测的研究具有广泛的应用价值.基于手工特征的传统方法难以预测复杂场景下的行人轨迹.深度学习以人工神经网络为架构,具有强大的学习能力,在各个领域取得了显著的效果.基于深度学习的行人轨迹预测方法已逐渐发展为一种趋势.为了宏观把握基于深度学习的行人轨迹预测的研究状况,首先,对不同方法进行组织与分类,比较不同方法的优缺点,讨论不同方法在行人轨迹预测领域的应用与发展
针对雷达装备在鉴定定型阶段的维修性评估问题,首先建立了定性与定量指标相结合的雷达装备维修性评估指标体系;其次,考虑对事物判断的犹豫度,避免权值为0的情况,采用了改进的区间直觉模糊熵(IVIFE)对指标进行赋权;最后运用灰关联投影评价模型(GRPM)进行了评估.实例分析验证了该方法的可行性,为鉴定定型阶段雷达装备维修性评估提供一种思路.
为了全面、客观分析飞翼布局无人机在实战中的隐身效果,对飞翼布局无人机的单双站RCS,以及侧向、径向和跨站飞行三种飞行模式,从静态、动态RCS特性和单双站的最大探测距离等方面进行综合隐身能力分析.分析结果表明,飞翼布局无人机侧向飞行时,双站雷达探测并不一定比单站雷达优;径向飞行时,双站雷达对飞翼布局无人机的探测能力较单站雷达更优,隐身材料能显著降低被探测概率;在跨站飞行模式下,单站雷达对其尾部探测效果较好,双站雷达对双站之间的区域探测性能较好,隐身材料对雷达探测率降低效果不明显.这为改进隐身结构设计、综合隐
针对双波束天波雷达工作中波束宽度与发射资源之间的矛盾,根据发射波束的扫描原理、常见的发射通道规划方法及雷达双波束扫描的实现方法,从工作频率、波束指向和发射机数量3个方面分析了影响发射波束宽度的因素;然后设置任务场景,给出了基于波束宽度的频率选择方法;最后设置模拟场景,对比不同频率对雷达作战效能的影响,验证了该方法的可行性.