扩展功能
文章信息
- 王九胜, 许辉, 缪中岩.
- WANG Jiu-sheng, XU Hui, MIAO Zhong-yan
- 基于时空关系的多细粒度隧道交通流预测模型研究与应用
- Study and Application of Multi Fine-grained Tunnel Traffic Flow Prediction Model Based on Spatio-temporal Relation
- 公路交通科技, 2024, 41(11): 86-93
- Journal of Highway and Transportation Research and Denelopment, 2024, 41(11): 86-93
- 10.3969/j.issn.1002-0268.2024.11.010
-
文章历史
- 收稿日期: 2024-01-15
2. 云上甘肃科技股份有限公司, 甘肃 兰州 730087
2. Yunshang Gansu Technology Co., Ltd., Lanzhou, Gansu 730087, China
随着城市化的推进和道路结构的复杂化,高速公路隧道的数量和交通流量持续增加。因此,隧道内发生事故的可能性也在不断上升,给隧道交通管理带来了越来越大的成本和复杂性负担。迫切需要建立隧道交通预警系统,以协助进行智能监测、预测和应急控制,从而构建端到端的安全、可管理的隧道交通控制系统[1-3]。隧道内交通流量预测是隧道交通预警系统的关键模块。通过分析历史交通流量数据,特别是在固定地点的一段时间内,目的是预测下一时间段的交通流量或对较长时间段内的趋势和周期性进行判断。通过分析预测数据,管理者可以提前识别可能导致拥堵的状况,比如高峰时段的车流增加、周末或节假日的特殊交通模式。当预测结果显示隧道即将面临高流量时,可以通过交通广播、应用程序通知或道路标志向司机发送预警,建议他们选择替代路线或出行时间。交通流预测可以辅助提高隧道交通管理的综合预警和引导能力。
隧道交通流量是在动态变化的,可能因事故、车辆故障、或者隧道入口或出口附近的交通拥堵在短时间内发生变化,也可能因天气条件(如暴雨或雪天)、路面条件(如冰滑或水淹)以及交通管制(如临时封路或限速)等发生天级变化,或出现火灾、化学品泄漏或其他危机情况,交通流量需在应急情况下立即调整。隧道交通预警系统中的交通流预测可被视为多元时间序列(MTS)预测任务。与单变量时间序列不同,在单变量时间序列中,数据是在特定时间段内以固定时间间隔从单个传感器采样的。在多元时间序列中,数据包括来自同一区域的多个传感器的样本。通常,不同来源的数据之间的关系称为空间关系,同一传感器在不同时间点的数据关系称为时间关系,不同传感器在不同时间点的数据关系称为时空关系。与其他时间序列不同,由于传感器差异或时间和位置的变化,隧道交通流数据表现出多粒度性质。例如,在节假日期间,交通流的采样频率可能较高,而在偏远的隧道中,采样频率可能较低。不同的采样频率导致不同地点的交通流数据的时间间隔不同,需要模型对不同粒度进行单独处理。与常规交通流对比,隧道交通流受到独特的环境条件影响,传感器安装数量少,隧道内的车流密度通常较高,且车速相对一致,所有车辆都受到隧道限速和空间限制的影响,并且隧道内的事故通常会导致更严重的交通延迟和拥堵。
多元时间序列(MTS)预测的关键在于将过去的信息与多个变量之间复杂的时空相关性相结合。相较于单变量时间序列预测,MTS预测更具挑战性,其与隧道交通流预测不同之处在于需要处理多粒度的数据。单变量时间序列预测已经有了大量研究,传统的自回归模型如ARIMA[4]长期以来一直是分析和预测的基石,可以采用自回归积分移动平均模型、卡尔曼滤波分析以及支持向量机(SVM)等机器学习方法[5],这些模型建立在假设时间序列与其过去的观测值之间存在线性关系的基础上,通过对过去的值、常数项和随机误差进行线性组合来预测未来值。然而,这些单变量时间序列预测方法难以满足多元预测的复杂条件。它们在处理非线性模式、非平稳序列以及复杂的多变量时间序列时面临着明显的局限性,很难有效地建立交通流数据中的时空关系,也不能揭示其中存在的时空依赖性。基于循环神经网络[6-8]的模型随着深度学习技术的发展,通过引入门控机制有效地解决了标准RNN在长序列训练过程中遇到的梯度消失问题,使模型能够学习到更长范围内的依赖关系,能够按照时间顺序逐步处理数据,具备捕获时间依赖性的能力,被应用于大多数时间序列预测任务。一些研究工作还探索了将LSTM与其他算法结合的混合模型,以解决特定领域的时间序列预测问题。Sagheer等[9]将LSTM与传统遗传算法相结合来预测石油行业的时间序列数据上进行测试。Nguyen等[10]将LSTM应用于供应链分析和预测。JIN等[11]利用LSTM来预测电力合规警告系统中的电力负荷,分析电力消耗产生的多个时间序列。Wang等[12]将LSTM与随机森林算法相结合预测碳价格。Ponnoprat等[13]构建了一个基于LSTM的自动编码器网络来预测每日降水时间序列数据。为了提高短期交通流预测的准确性,沈富鑫等[14]提出了一种基于自适应噪声完全集成经验模态分解和人工蜂群算法优化LSTM的短期交通流预测方法。张潇潇等[15]利用高速公路交通流的时间特征,为沪渝高速公路建立了基于LSTM的短期交通流预测模型。然而,它们在捕捉交通流数据的空间特征方面面临着挑战,并且不能直接过滤掉影响模型性能的基本特征。LSTM模型要求输入和输出的长度相等,并存在长时序记忆遗忘问题。模型的特征提取能力随输入片段的增长而下降。一些图神经网络模型,如GCN和T-GCN,可以从数据中提取时空关系,但在预测多粒度数据方面存在不足。
不同于传统注意力机制在进行计算时需要引入额外的外部信息,自注意力机制[16]从自身信息出发,提取特征,无需引入冗余的外部信息。近年来,注意力机制的引入进一步革新了时间序列分析领域。特别是,自注意力机制(如在Transformer模型中使用的那种)提供了一种在不依赖传统递归架构的同时捕获长距离依赖关系的方法。这种机制通过对序列中不同部分的关注度进行动态调整,允许模型更有效地学习序列内的关键信息,从而显著提高了多变量时间序列预测的性能和效率。结合自注意力机制的模型在多个应用领域,如交通流量预测、电力需求预测、金融市场分析等,都表现出了卓越的性能。例如,MCST-Transformer模型就是在考虑时间和空间依赖性的基础上,通过融合多通道交通数据来进行精确预测的一种新型架构。Wang等[17]证明了该注意力机制在多传感器融合领域的有效性。Raganato等[18]改进了注意力机制并应用于自然语言处理等领域。Yin等[19]利用该注意力机制处理时序数据集中的空间关系,构建生成对抗网络来完成MTS预测。周楚昊等[20]提出了一种考虑时空关联的多通道交通流预测方法(MCST-Transformer)对广东省高速公路流量进行高精度预测。受到Transformer和特征金字塔网络(FPN)架构的启发,我们提出了一种新颖的时空特征提取方法和多粒度融合预测,以解决这些问题。同时,基于SCINet[21],我们对网络架构进行了重新设计。首先,我们采用多粒度融合预测模块对数据粒度进行一级融合,并在特征粒度上进行二级融合。其次,我们使用自注意力机制来提取交通流数据中的时空关系,使网络模型能够学习不同特征对预测任务的影响。这种对不同特征的权重动态分配有助于实现对隧道交通流数据的准确预测。
本研究贡献如下:(1)创新提出多细粒度融合预测模块。针对隧道交通流数据多时间间隔的特性进行时序预测,提升预测的连续性。(2)提出时空关系特征提取模块。引入自注意力机制使网络模型学习数据流中的时空关系,提升模型预测的精准度。
1 基于时空关系的多细粒度隧道交通流预测模型 1.1 总体模型网络模型整体结构如图 1所示,该模型总共由两大模块组成:多细粒度特征融合模块、时空关系特征提取模块。Fodd为特征通道为奇数的特征组合成的特征图;Feven为特征通道为偶数的特征组合成的特征图。模型输入为隧道内不同位置的传感器的多细粒度流量数据,首先将多细粒度的隧道交通流数据进行数据层的一次融合与特征层的二次融合,提取多细粒度融合特征,随后将特征送入由自注意力模块与交叉学习模块提取多元数据的时空关系依赖,并进行时序数据的预测。
|
| 图 1 总体模型架构 Fig. 1 Overall model architecture |
| |
1.2 多细粒度特征融合模块
隧道交通数据因传感器在隧道内的分布不同,采样频率也不同。导致交通流原始数据会有采样频率5 min到1 d的差距,多种细粒度的数据是模型很难拟合,也不易学习到数据流本身的特征。为了解决以上问题,本研究提出多细粒度融合预测模块, 首先将多细粒度的数据在数据预处理中进行数据级一次融合,随后在特征提取阶段对多细粒度数据进行特征级二次融合,具体模块结构如图 2所示。
|
| 图 2 多细粒度特征融合模块结构 Fig. 2 Structure of multi fine-grained feature fusion module |
| |
首先,我们将高细粒度的数据(5 min采样频率)按照采样频率倍数成组的整合到上一级较粗的细粒度数据(15 min采样频率)中,再将较粗细粒度数据按照相同步骤整合到上一级更粗细粒度的数据中,完成数据层面的一次融合。该融合步骤不仅可以使得粗细粒度的数据中有上一级细粒度数据的特征,而且每个上级细粒度数据都可以有一定程度的数据扩充,增加训练数据样本。其次,将不同细粒度数据送入卷积模块提取数据特征,将每种特征维度对齐后拼接,形成拼接特征矩阵,将矩阵继续送入卷积模块提取特征层面的多种细粒度融合特征,输出针对多细粒度数据的融合特征,完成二次融合。
1.3 时空关系特征提取模块由于自然语言处理领域中Transformer模型基于自注意力机制的成功,因此采用自注意力机制来让模型学习MTS预测所需的时空关系特征。为在避免引入额外外部信息的同时实现并行计算。在标准的自注意力机制中,原始向量被编码为3个新向量,分别映射到3个不同的高维空间,这些向量分别是Q(query)、K(key)和V(value)。自注意力机制通过计算query和key之间的相似度,然后使用softmax函数计算注意力分数,整个过程如下:
|
(1) |
|
(2) |
|
(3) |
|
(4) |
|
(5) |
式中,x为特征矩阵;w为可学习的参数矩阵;·表示矩阵乘法;Q, K,V均为自注意力机制公式的三个输入矩阵,由对应的x和W的乘积组成。
将经过自注意力模块提取到的特征F通过拆分和交互学习两个操作被分解为两个子特征和, 拆分过程通过分离偶数和奇数元素,将原始序列F下采样为两个子序列和,它们的时间粒度较粗,但保留了原始序列的大部分信息。之后使用不同的卷积核从和中提取特征, 由于卷积核是独立的,因此从中提取的特征将包含同质和异构信息,并具有高维的表示能力。为了弥补由于下采样丢失的潜在信息,使用交互学习策略,通过相互学习仿射变换参数促进两个子序列之间的信息交换。
首先,Feven和Fodd分别使用两个不同的一维卷积模块φ和ψ投影到高维空间,非线性转换后与Fodd和Feven对应元素相乘。这可以看作是执行缩放变换,其中缩放因子是使用神经网络模块相互学习的。⊙表示对应元素相乘。
|
(6) |
|
(7) |
|
(8) |
|
(9) |
而后,两个缩放特征和使用两个独立的一维卷积模块ρ和η进行非线性变换后与和相加, 得到两个更新的子特征和,两个子特征合并后经过LSTM输出时序预测结果。与TCN架构中使用的扩张卷积相比,交互学习的方式实现了更大的感受野, 并且与在每一层中使用单个共享卷积滤波器的TCN不同,交互学习根据给定的预测监督聚合从两个下采样子序列中提取的基本信息,显著增强了其特征提取能力。
2 试验结果分析 2.1 试验设置与数据集本研究采用Pytorch构建了一套多细粒度隧道交通流预测模型。在模型权重的更新上,选择了MAE作为损失函数,并使用Adam优化器。为了验证模型的性能,使用了交通流公开数据集PEMS8、PEMS4以及中国省级京台高速公路隧道群交通流数据。京台高速公路是连接北京和台北的一条重要高速公路。作为中国高速公路网的一部分,在京台高速公路上,隧道群是其重要组成部分,尤其是在穿越山区时。这些隧道群通常包括长隧道、短隧道和连续隧道组合,隧道内部配备激光雷达、毫米波雷达、视觉摄像头等多种模态传感器用以检测车辆在高速公路隧道群内部的行驶情况。为了进行有效的训练,按照8∶1∶1的比例划分了数据,分别用作训练集、验证集和测试集。
2.2 评价指标使用平均绝对误差(MAE)、均方根误差(RMSE)来衡量预测结果与真实标签之间的差异。它们的定义具体为:
|
(10) |
|
(11) |
在PEMS4、PEMS8和中国省级隧道群交通流数据上,通过对比试验得到了本研究模型和其他对比模型的数据预测误差结果,具体数值列于表 1~表 3中。本研究综合考虑了不同架构类型的模型,包括图神经网络[22]、循环神经网络、卷积神经网络等。通过对比这些模型在3个数据集上的性能,可以明显看出,本研究模型在交通流数据预测方面表现出色。在3个交通流预测数据集中,对比LSTM、TCN、STGCNN等当前时序预测先进网络,本研究所提出的模型预测误差最低;在国内隧道交通流数据集中,选取了在公共数据集上表现出色或最先进的网络模型进行对比,本研究模型的预测误差可达到57.06。
| 数据集 | 方法 | MAE | RMSE |
| PEMS8 | LSTM | 22.20 | 32.06 |
| TCN | 22.72 | 35.79 | |
| DCRNN | 17.86 | 27.83 | |
| STGCN | 18.02 | 27.83 | |
| ASTGCN | 18.61 | 28.16 | |
| GraphWaveNet | 19.13 | 31.05 | |
| STSGCN | 17.13 | 26.80 | |
| 本研究方法 | 16.54 | 26.11 |
预测结果如图 3~5所示,图中展示了模型在3个数据集中4个不同传感器上的预测结果。通过观察这些结果,可以发现模型准确地捕捉到了空间和时间相关性,使得预测值与真实值之间的吻合度非常高。此外,模型还能够有效地预测出交通数据流的周期性和趋势。在各个传感器上,当交通数据出现急剧上升或急剧下降的时间段时,模型能够稳定地预测出这些突变的时间和状态。
|
| 图 3 本研究提出模型在PEMS4上的预测效果 Fig. 3 Proposed model prediction effect on PEMS4 |
| |
|
| 图 4 本研究提出模型在PEMS8上的预测效果 Fig. 4 Proposed model prediction effect on PEMS8 |
| |
|
| 图 5 本研究提出模型在隧道交通流数据上的预测效果 Fig. 5 Proposed model prediction effect on tunnel traffic flow data |
| |
3 结论
在本研究中,针对传统方法难以有效地提取多细粒度时空序列特征的问题,提出多细粒度融合预测模块与时空关系特征提取模块。通过将不同细粒度数据进行数据层的一次融合与特征层的二次融合,提高模型对不同细粒度数据的特征提取能力,引入时空自注意力机制与交互学习策略,提高了模型捕捉序列时空关系的能力。在交通流公开数据集(PEMS4、PEMS8)与中国隧道交通流数据上的试验结果表明,我们提出的模型在时序预测任务尤其是隧道交通流预测任务中是非常有效的。在未来的工作中,我们将尝试使用图卷积神经网络提取隧道不同地点流量间的空间关系依赖。
| [1] |
闫杨, 孙丽珺, 朱兰婷. 基于时空相关性的短时交通流量预测方法[J]. 计算机工程, 2020, 46(1): 31-37. YAN Yang, SUN Li-jun, ZHU Lan-ting. Short-term Traffic Flow Prediction Method Based on Spatiotemporal Relativity[J]. Computer Engineering, 2020, 46(1): 31-37. |
| [2] |
雷斌, 李佳璐, 张鹏, 等. 基于多图时空图卷积模型的城市交通流长时预测[J]. 公路交通科技, 2024, 41(4): 204-213. LEI Bin, LI Jia-lu, ZHANG Peng, et al. Long Term Prediction on Urban Traffic Flow Based on Multi-source Spatio-temporal Graph Convolutional Neural Network Model[J]. Journal of Highway and Transportation Research and Development, 2024, 41(4): 204-213. |
| [3] |
闻川, 成卫, 肖海承. 基于多维流量特征的短时交通流量预测模型[J]. 公路交通科技, 2023, 40(7): 191-199. WEN Chuan, CHENG Wei, XIAO Hai-cheng. A Model for Predicting Short-term Traffic Volume Based on Multi-dimensional Traffic Volume Characteristics[J]. Journal of Highway and Transportation Research and Development, 2023, 40(7): 191-199. |
| [4] |
BOX G E P, PIERCE D A. Distribution of Residual Autocorrelations in Autoregressive-integrated Moving Average Time Series Models[J].
Journal of the American Statistical Association, 1970, 332(65): 1509-1526.
|
| [5] |
HEARST M A, DUNAIS S T, OSUNA E, et al. Support Vector Machines[J].
IEEE Intelligent Systems and Their Applications, 1998, 13(4): 18-28.
DOI:10.1109/5254.708428 |
| [6] |
ZAREMBA W, SUTSKEVER I, VINYALS O. Recurrent Neural Network Regularization[J/OL]. ArXiv Preprint, 2014(2015-02-19)[2023-09-17]. http://arxiv.org/abs/1409.2329, doi: 10.48550/ARXIV.1409.2329.
|
| [7] |
GRAVES A. Long Short-term Memory[M]. Supervised Sequence Labelling with Recurrent Neural Networks. Berlin: Springer, 2012, 385: 37-45.
|
| [8] |
CHO K, MERRIENBOER B, GULCEHRE C, et al. Learning Phrase Representations Using RNN Encoder-decoder for Statistical Machine Translation[J/OL]. ArXiv Preprint ArXiv: 1406.1078, 2014. (2024-09-03)[2023-08-13]. http://arxiv.org/abs/1406.1078, doi: 10.48550/ARXIV.1406.107.
|
| [9] |
SAGHEER A, KOTB M. Time Series Forecasting of Petroleum Production Using Deep LSTM Recurrent Networks[J].
Neurocomputing, 2019, 323: 203-213.
DOI:10.1016/j.neucom.2018.09.082 |
| [10] |
NGUYEN H D, TRAN K P, THOMASSEY S, et al. Forecasting and Anomaly Detection Approaches Using LSTM and LSTM Autoencoder Techniques with the Applications in Supply Chain Management[J].
International Journal of Information Management, 2021, 57: 102282.
DOI:10.1016/j.ijinfomgt.2020.102282 |
| [11] |
JIN X B, ZHENG W Z, KONG J L, et al. Deep-learning Forecasting Method for Electric Power Load via Attention-based Encoder-decoder with Bayesian Optimization[J].
Energies, 2021, 14(6): 1596.
DOI:10.3390/en14061596 |
| [12] |
WANG J, SUN X, CHENG Q, et al. An Innovative Random Forest-based Nonlinear Ensemble Paradigm of Improved Feature Extraction and Deep Learning for Carbon Price Forecasting[J].
Science of the Total Environment, 2021, 762: 143099.
DOI:10.1016/j.scitotenv.2020.143099 |
| [13] |
PONNOPRAT D. Short-term Daily Precipitation Forecasting with Seasonally-integrated Autoencoder[J].
Applied Soft Computing, 2021, 102: 107083.
DOI:10.1016/j.asoc.2021.107083 |
| [14] |
沈富鑫, 邴其春, 张伟健, 等. 基于CEEMDAN-ABC-LSTM组合模型的短时交通流预测[J]. 青岛理工大学学报, 2022, 43(5): 96-103, 119. SHEN Fu-xin, BING Qi-chun, ZHANG Wei-jian, et al. Short-term Traffic Flow Prediction Based on CEEMDAN-ABC-LSTM Combined Model[J]. Journal of Qingdao Technological University, 2022, 43(5): 96-103, 119. |
| [15] |
张潇潇, 龚龑. 基于LSTM的沪渝高速公路短时交通流预测研究[J]. 中国交通信息化, 2022(9): 133-137. ZHANG Xiao-xiao, GONG Yan. Research on Short-term Traffic Flow Prediction of Shanghai-Chongqing Expressway Based on LSTM[J]. China ITS Journal, 2022(9): 133-137. |
| [16] |
VASWANI A. Attention is All You Need[C]//Proceedings of the 31st International Conference on Neural Information Processing Systems: California: s. n., 2017: 6000-6010.
|
| [17] |
WANG B, LEI Y, LI N, et al. Multiscale Convolutional Attention Network for Predicting Remaining Useful Life of Machinery[J].
IEEE Transactions on Industrial Electronics, 2021, 68(8): 7496-7504.
DOI:10.1109/TIE.2020.3003649 |
| [18] |
RAGANATO A, SCHERRER Y, TIEDEMANN J. Fixed Encoder Self-attention Patterns in Transformer-based Machine Translation[J/OL]. ArXiv Preprint 2020. (2020-10-05)[2023-05-16]. http://arxiv.org/abs/2002.10260, doi: 10.48550/ARXIV.2002.10260.
|
| [19] |
YIN X, HAN Y, SUN H, et al. Multi-Attention Generative Adversarial Network for Multivariate Time Series Prediction[J].
IEEE Access, 2021(9): 57351-57363.
|
| [20] |
周楚昊, 林培群. 基于多通道Transformer的交通量预测方法[J]. 计算机应用研究, 2023, 2: 435-439. ZHOU Chu-hao, LIN Pei-qun. Traffic Volume Prediction Method Based on Multi-channel Transformer[J]. Application Research of Computers, 2023, 2: 435-439. |
| [21] |
LIU M, ZENG A, CHEN M, et al. SCINet: Time Series Modeling and Forecasting with Sample Convolution and Interaction[J].
Advances in Neural Information Processing Systems, 2022, 35: 5816-5828.
|
| [22] |
冯凤江, 杨增刊. 基于图卷积和注意力机制的高速公路交通流预测[J]. 公路交通科技, 2023, 40(9): 215-223. FENG Feng-jiang, YANG Zeng-kan. Expressway Traffic Flow Forecast Based on Graph Convolution and Attention Mechanism[J]. Journal of Highway and Transportation Research and Development, 2023, 40(9): 215-223. |
| [23] |
BAI S, KOLTER J Z, KOLTUN V. An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling[J/OL]. ArXiv Preprint 2018, (2018-04-19)[2023-06-18]. http://arxiv.org/abs/1803.01271. doi: 10.48550/ARXIV.1803.01271.
|
| [24] |
LI Y, YU R, SHAHABI C et al. Diffusion Convolutional Recurrent Neural Network: Data-driven Traffic Forecasting[J/OL]. ArXiv Preprint. 2017, (2018-02-22)[2023-04-24]. http://arxiv.org/abs/1707.01926. doi: 10.48550/arXiv.1707.01926.
|
| [25] |
YU B, YIN H, ZHU Z. Spatio-Temporal Graph Convolutional Networks: A Deep Learning Framework for Traffic Forecasting[C]// Proceedings of the 27th International Joint Conference on Artificial Intelligence. Stockholm, Sweden, 2018: 3634-3640.
|
| [26] |
GUO S, LIN Y, FENG N, et al. Attention Based Spatial-temporal Graph Convolutional Networks for Traffic Flow Forecasting[J].
Attention Based Spatial-temporal Graph Convolutional Networks for Traffic Flow Forecasting, 2019, 33: 922-929.
|
| [27] |
WU Z, PAN S, LONG G, et al. Graph WaveNet for Deep Spatial-temporal Graph Modeling[J/OL]. ArXiv Preprint 2019, (2019-05-31)[2023-04-27]. http://arxiv.org/abs/1906.00121. doi: 10.48550/ARXIV.1906.00121.
|
| [28] |
LI M, ZHU Z. Spatial-Temporal Fusion Graph Neural Networks for Traffic Flow Forecasting[C]. //Proceedings of the AAAI Conference on Artificial Intelligence, California: AAAI Press, 2021. doi: https://doi.org/10.1609/aaai.v35i5.16542
|
2024, Vol. 41


,