1.4 道路短期交通状态时空序列预测研究概要性综述

鉴于道路交通状态时空序列预测(交通出行速度预测、区域流量需求预测、人流聚集预测等)是许多智能交通应用(如区域交通控制、路径诱导等)的核心基础问题,长期以来一直受到了广泛的关注,并进行了深入的研究,其研究至少有60年以上的历史跨度[2]

如图1-5所示,针对道路交通状态时空序列预测的方法论总体上可以分为模型驱动和数据驱动两大类[3]。早期的预测模型主要是基于模型驱动的方法,也称为参数类方法,如时间序列模型(ARIMA及其各种变体)[4-6]、滤波类模型[7-9],以及时间序列和滤波方法相结合的混合模型[10-12]。这些模型成为主流,符合当时时代的特点:统计学方法成熟且数据样本量相对不大(小数据时代)。在通常情况下,参数类模型都有以下不足,使其预测性能效果不佳:①很强的条件假设(如时间序列的平稳性等),不适用于复杂多变的道路交通预测;②对每个观测的位置单元进行单独的预测,缺乏空间相关性的考量。随着交通检测器(如线圈检测器、视频检测器等)、车载GPS等设备的普及,越来越多与道路交通相关的数据被采集和存储起来,构成了交通大数据,从而使得道路交通时空序列预测的研究从模型驱动方法向数据驱动方法演变。数据驱动类方法大致可以分为两类:传统机器学习类方法和深度学习类方法。这些研究方法的出现也十分吻合方法论时代发展的特点,20世纪八九十年代机器学习理论得到了长足的发展和大规模的商业化应用,尤其是支持向量机(SVM)在机器学习领域取得了辉煌的成就,一度占据了机器学习的王者地位。因此,相关理论如SVM、SVR等也被应用于道路交通预测问题的研究[13-15]。此外,部分研究还采用了贝叶斯方法[16]、KNN[17]等进行相应的道路交通预测研究。虽然传统的机器学习方法拥有稳固的理论基础,能够帮助我们有效理解预测的过程,但是在处理复杂、高度非线性交通数据时仍旧表现出预测性能不佳,并且需要非常细致的手动特征工程[18]。2006年,Hinton等人提出了深层网络训练中梯度消失问题的解决方案:深度置信网络(DBN)[19],从此开启了深度学习方法论时代。深度学习通过很多层的非线性神经元的堆叠,能够在输入和输出之间实现高度复杂的非线性变换,使深度网络模型拥有强大的表征能力,非常适合针对大数据量、复杂、端到端(与传统机器学习需要大量手动特征工程的显著区别)的建模问题。因此,近年来,再次看到了前沿方法论在道路交通预测领域掀起的研究热潮:基于深度学习的道路交通时空预测。正是在这样的背景下,本书才得以构思成型,试图从当前的研究热潮中,系统深入地梳理出当前深度学习理论在道路交通状态时空序列预测领域的主要研究脉络和主要研究细节,以便总结当前研究,为未来的创新提供线索和起点。

图1-5 道路交通状态时空序列预测研究方法论划分