论文部分内容阅读
日益严重的交通问题已成为全球性的顽疾,它不仅影响个人生活和社会经济活动,而且涉及到环境、能源和安全等当今世界关注的重要议题。智能交通系统(ITS)被公认是解决道路交通问题的有效途径,而交通流预测又是其主要的支撑技术基础。高效、准确、鲁棒的预测方法可以有效地改善ITS功能,更好地发挥其在道路交通管理和服务的作用。 道路网交通流具有高维、时变和复杂的特点。高维性体现为交通流数据涉及多种描述参数,数据采自路网多个不同时空位置,并以源源不断的数据流形式涌现;时变性表现为交通状态随时间发生的持续性变化,包括流数据分布变化以及交通参数之间的变化;复杂性源于众多不确定因素(例如大量具有随机性的交通参与者、天气、拥堵、事故等)的相互作用,表现为随机变化和程度不一的异常。 传统的交通流预测多为时序的方法,并且通常只是孤立地对某一路段/出口的交通流建立局部预测模型。然而,道路交通是一个在时空上彼此关联的复杂系统,复杂性体现在随机涨落变化(群体行为所致),时空性则反映为某一位置的变化是由上游交通情况决定,包括传递量和时延。显然,传统的局部时序预测思想忽视了这种空间的物质基础和时延规律,即使模型先进,也无异于刻舟求剑,用到复杂的交通上自然不会有好的普适效果和鲁棒性。事实上,交通预测如同天气和水文预报,不应仅靠上一时刻表象就地做推测,更需要领域的相关知识。因此,本文通过对全路网车辆进出的真实交通数据进行分析,将领域知识结合到交通流预测建模中,把数据驱动和模型驱动的方法融合在一起,进而有效改进预测的准确性和算法性能。 本文的主要研究目的是结合交通流的特点,从全路网的角度出发,通过挖掘高速公路网的时空关联模式,利用交通的领域知识,融合数据驱动和模型驱动的思想,对现有的交通流预测问题进行改进,使之取得更好的效果。本文通过研究时空关联的挖掘,对预测模型面临的高维交通数据的特征选择问题,交通非常态下的误差反馈校正问题,以及路网的整体预测问题进行深入分析研究。论文主要工作和贡献包括: (1)基于路网时空关联的特征选择方法。交通数据包含大量特征,具有高维数据的特点,直接使用所有特征将大大增加计算代价,“维度灾难”会使非参数回归以及神经网络等预测模型失效,无法满足交通流预测的实时性要求,因此,合理的特征选择是交通流预测的重要基础。为此,本文通过分析高速公路网的交通流特点,设计一套路网交通流时空关联挖掘的方法,利用时空关联模式提取预测模型所需要的特征。通过结合领域知识,本方法解决了传统特征选择算法在无关以及冗余特征排除方面的局限性,并且又保持了较高的计算效能。 (2)基于路网时空关联的非常态交通流预测研究。交通流具有时变性和复杂性,变量的数据分布、变量之间的关系可能随时间发生变化。非参数回归作为一种懒惰学习方法,将数据不断加入到历史数据集中。这种简单的学习机制不足以完全适应时变的交通场景。特别是交通的非常态,如果数据在历史上没有出现,则非参数回归模型预测准确率会急剧下降。本文通过上述挖掘出的路网时空关联模式,发现了交通非常态变化的根源,以此建立多元回归模型,对非参数交通流预测模型进行实时校正,将模型驱动(时空关联)与数据驱动(非参数回归)相融合,使整体预测模型能够快速适应当前的交通环境,提升了非常态交通流的预测准确率。 (3)基于路网时空关联的多任务预测分析研究。传统的交通流预测通常是只是孤立地对某一路段建立局部预测模型,属于单任务方法,这类模型忽视了问题域中各任务之间存在的关联特性,而这种关联信息往往能够有效提升预测效果。事实上,每条路段的流量都与其上游路段密切相关,这也是本文基于全路网进行预测研究的背景。提出多任务学习方法就是要利用任务之间所蕴涵的相关信息来提高预测效率。本文在已有的路段时空模式基础上,进一步挖掘路段之间的关联关系,建立路网的多任务预测模型。进而有效地降低了整体的输入维度,在提高预测精度同时也改善了计算效率。 本论文研究工作在山西和安徽两个省域的高速公路网交通流数据上进行了实验和验证,目前已经部署在山西、安徽两省的高速公路运营管理和决策支持系统中,具有很好的实用性。