扩展功能
文章信息
- 王少杰, 曲大义, 刘浩敏, 孟奕名, 崔善柠.
- WANG Shao-jie, QU Da-yi, LIU Hao-min, MENG Yi-ming, CUI Shan-ning
- 面向数据驱动的车辆跟驰行为建模
- Modeling of Car-following Behavior Based on Data-driven Method
- 公路交通科技, 2023, 40(11): 222-228
- Journal of Highway and Transportation Research and Denelopment, 2023, 40(11): 222-228
- 10.3969/j.issn.1002-0268.2023.11.026
-
文章历史
- 收稿日期: 2021-12-29
2. 天津市道路运输事业发展服务中心, 天津 300384;
3. 青岛理工大学 土木工程学院, 山东 青岛 266520
2. Tianjin Road Transportation Business Development Service Center, Tianjin 300384, China;
3. School of Civil Engineering, Qingdao University of Technology, Qingdao Shandong 266520, China
随着城市化不断加快,交通量不断增加,交通拥堵等现象日益显著。车辆跟驰模型作为交通流领域研究热点,研究车辆跟驰行为可以理解交通流运行特性,从而解决拥堵等交通问题。跟驰模型可分为理论驱动类和数据驱动类。理论驱动类是指根据车辆跟驰行为,运用运动学知识,构建有明确物理意义的模型,如Pipes[1]构建的理论驱动类跟驰模型、GHR模型[2-3]、Helly[4]提出的刺激-反应类跟驰模型、FVD模型[5]、IDM模型[6]、Gipps构建的安全距离类跟驰模型[7]、分子跟驰模型[8]、基于分子动力学的车流运行态性模型[9]等。随着智能化的不断发展,数据驱动模型逐渐兴起,此类模型基于大量轨迹数据完成建模,充分发掘数据信息之间的联系,从而精准预测车辆跟驰行为。Kehtarnavaz等[10]应用BP神经网络建立车辆跟驰模型;贾洪飞等[11]基于BP神经网络理论建立模型,模拟仿真车辆跟驰行为;Wei等[12]基于支持向量回归的理论构建跟驰模型,误差评价指标显示,该模型有较高的评价精度;Zhou等[13]提出了基于RNN的跟驰模型,因输入变量考虑了时间序列数据,故能够得到驾驶人的反应时间、预测能力或记忆效应,可较好地重现交通震荡和区分驾驶人特征的能力;Wang等[14]应用门控循环单元神经网络结构对车辆跟驰行为进行建模,该模型输入为最近几个时步的速度、相对速度与位移,输出为速度,并进行仿真试验,预测效果良好;Huang等[15]提出基于LSTM神经网络的跟驰模型,仿真结果显示该模型能够较好地捕获非对称驾驶行为;孙倩等[16]通过进行实车试验提取轨迹数据,构建的基于LSTM的车辆跟驰模型稳定且可以消散交通流中的扰动,抗干扰能力与预测效果良好;费蓉等[17]构建了基于门控单元网络的车辆跟驰模型并进行了仿真试验,仿真验证模型有效性。
上述数据驱动类跟驰模型有效预测驾驶员跟驰行为,但不能有效提取输入数据特征以及加强对重要特征的关注。基于上述研究成果,CNN可提取输入数据特征,BiLSTM能够处理长时间序列数据并可以选择性获取与遗忘历史信息,与人类驾驶过程中驾驶员根据不同的短期记忆决策一致, 并可以充分提取正向与反向的数据特征,Attention机制可加强对输入特征中重要部分的重视程度。因此,本研究构建了基于CNN-BiLSTM-Attention的车辆跟驰模型,利用车辆轨迹数据训练模型与标定相关参数,与LSTM,GRU,CNN-BiLSTM等数据驱动跟驰模型对比,比较预测精度,验证模型的预测精度。
1 考虑GM的数据驱动型跟驰行为建模本研究结合GM跟驰模型思想,进行基于CNN-BiLSTM-Attention的车辆跟驰模型的构建,所应用到的理论基础有GM跟驰模型、CNN模型、BiLSTM神经网络结构、Attention机制。
1.1 GM跟驰模型GM跟驰模型[3]是典型的刺激-反应类跟驰模型,假设跟驰后车加速度与自身车速、两车相对速度和车头间距有关,表达式为:
|
(1) |
式中,an+1(t+T)为车辆n+1在t+T时刻的加速度;vn+1(t+T)为车辆n+1在t+T时刻的速度;Δv(t) 为两车在t时刻的相对速度;xn(t),xn+1(t)分别为两车在t时刻的位移;T为反应时间;α为待标定的灵敏度参数;m和l为模型标定参数。
理论驱动模型中,众多刺激-反应类跟驰模型均在GM跟驰模型的基础上建立,该模型较为经典且应用广泛。GM跟驰模型物理意义明确,模型结构简单,故本研究选择结合GM跟驰模型的建模思想进行建模。
1.2 CNN模型CNN模型被用于图像识别、语音识别以及交通流预测等相关领域。CNN模型由输入层、输出层和隐藏层构成,隐藏层中核心为卷积层和池化层,可实现提取数据特征、降低数据量的功能,从而提高训练速度。卷积操作如图 1所示,以三阶卷积核为例。
|
| 图 1 卷积操作 Fig. 1 Convolution operation |
| |
三阶卷积核的卷积操作表达式为:
|
(2) |
式中,cij为卷积结果;ω为卷积核内数值;x为输入数据。池化层进行特征选择以降低数据量,从而得到强特征。池化层表达式如下:
|
(3) |
式中,zi为池化层输出;ji为池化层输入;pool为池化运算。CNN模型可实现输入数据特征提取以及对输入特征内在联系进行深度挖掘,故本研究选择CNN模型进行建模。
1.3 BiLSTM神经网络结构具有遗忘门的LSTM神经网络可以获取历史信息,当历史数据信息过时,可对记忆模块进行重置逐步去除,这与人类的驾驶过程非常一致,驾驶人根据不同的短期历史信息做出决策。LSTM模型由输入层、隐藏层与输出层构成。其中隐藏层主要用于输入数据的特征学习,其中以记忆模块为主要单元。LSTM单元包含遗忘门ft、输入门it和输出门ot,遗忘门控制t-1时刻细胞状态ct-1遗忘的信息,输入门控制t时刻输入xt保留进入细胞状态ct的信息,输出门控制t时刻细胞状态ct进入隐藏状态ht的信息,单元结构如图 2所示。
|
| 图 2 LSTM单元 Fig. 2 Unit of LSTM |
| |
LSTM单元相关公式如下:
|
(4) |
|
(5) |
|
(6) |
|
(7) |
|
(8) |
|
(9) |
式中,Wif,Whf,Wii,Whi,Wio,Who,Wic,Whc为权重矩阵;bif,bhf,bii,bhi,bio,bho,bic,bhc为偏置。
σ为siomoid激活函数,公式如下:
|
(10) |
tanh为激活函数,公式如下:
|
(11) |
LSTM只能够获得正向传递而来的历史信息,导致预测过程中出现滞后现象。BiLSTM由方向相反的2个LSTM神经网络单元组成,可同时考虑正向与反向两方向的数据信息。对正、反向两方向数据进行预测,2个独立隐藏层可分别处理两方向数据,其输出由两方向的输出共同决定,从而减小预测误差,故选择BiLSTM神经网络进行建模,如图 3所示。
|
| 图 3 BiLSTM结构 Fig. 3 Structure of BiLSTM |
| |
1.4 Attention机制
注意力机制是指人脑处理应对特定信息时,会将注意力集中在关键区域,以获得重要信息[18]。注意力机制对输入特征赋予权重,从而着重关注输入特征重要部分, 结构如图 4所示。
|
| 图 4 Attention结构 Fig. 4 Structure of Attention |
| |
Attention内部结构相关公式如下:
|
(12) |
|
(13) |
|
(14) |
式中,et为t时刻特征对应权重;αt为t时刻特征对应注意力权重;v,W为共享权重;b为偏置;ct为t时刻的输出。Attention机制可自动调节初始输入特征对应隐藏层状态值,对输入特征加权,从而突出输入特征中重要特征。与驾驶员跟驰决策过程中着重关注重要信息机制相一致,故本研究选择引入Attention机制完成模型构建。
1.5 CNN-BiLSTM-Attention跟驰模型使用Keras完成基于CNN-BiLSTM-Attention跟驰模型的构建与训练,后端使用TensorFlow。选择合适的输入与输出可提高模型的精确度,结合GM模型思想,输入为t时的跟驰后车速度vn+1(t)、两车t时速度差Δv(t)与t时两车间距Δx (t)作为输入,输出为将下一时间间隔跟驰后车加速度an+1(t+Δt),确定输入输出后建立模型,目标函数如下所示:
|
(15) |
CNN-BiLSTM-Attention模型由CNN层、BiLSTM层、Attention层与全连接层构成, 如图 5所示。。CNN层可实现提取输入数据特征,BiLSTM可充分提取正向与反向特征,Attention层加强模型对重要特征的关注。
|
| 图 5 CNN-BiLSTM-Attention模型结构 Fig. 5 Structure of CNN-BiLSTM-Attention model |
| |
2 模型参数设置 2.1 数据处理
本研究采用NGSIM(Next Generation Simulation)项目中美国加州I-80高速公路东行方向收集的车辆轨迹数据作为数据集。数据由架设在毗邻I-80高速公路的高楼的7台摄像机获取,帧频为10帧/s。数据采集路段长为503 m, 共6个车道,车道1为多乘员车道,车道6为入口匝道,数据采集路段情况如图 6所示。
|
| 图 6 I-80路段具体情况 (单位:m) Fig. 6 Specific situation of I-80 road section (unit: m) |
| |
本研究对车辆跟驰行为及其微观特性进行研究,为充分反映加速度变化交通流状况,选取道路状况为拥堵时的轨迹数据,即下午05 : 00—05 : 15时段数据集。为得到充足的符合车辆跟驰特性的轨迹数据,以完成跟驰模型的训练与标定,需对上述数据集进行筛选,原则如下:
(1) 筛选车辆类型为2的车辆,即小型车,避免不同车辆造成跟驰特性的不同;
(2) 剔除车道1和车道6,保证驾驶行为一致;
(3) 剔除前后方都无车的车辆;
(4) 筛选未变换车道的车辆,避免变换车道的影响;
(5) 剔除车头间距小于5 m,大于60 m的轨迹数据,视为跟驰行为解除;
(6) 筛选跟驰时间超过60 s的轨迹数据,确保完整的跟驰过程及充足的轨迹数据。
数据集通过计算机识别技术提取视频图像获取,存在大量测量误差与异常值,不能满足车辆微观行为特性研究需求,需进行数据降噪。通过移动平均法完成数据降噪,以vehicleID为295的车辆为例,速度与加速度降噪结果如图 7所示。
|
| 图 7 降噪结果 Fig. 7 Result of noise reduction |
| |
筛选降噪处理后共得到266 778条数据,数据中80%用于模型训练,其余20%用于模型验证。对预处理后的数据进行归一化处理,将原始数据映射到[0-1]之间,以消除量纲的影响,公式如下:
|
(16) |
式中, xmax为原始数据最大值;xmin为原始数据最小值。
2.2 评价指标选择选择平均绝对误差MAE、拟合系数R2和均方误差MSE作为评价指标。
|
(17) |
|
(18) |
|
(19) |
式中, n为评价数据样本总数;yi为评价数据真实值;yi为评价数据真实值均值;
模型参数决定了预测精度,为提高模型预测精度,通过试验验证,设置CNN层卷积核大小为1×1,卷积步长设为1,激活函数设置为ReLU,优化器选择Adam,损失函数设置为MSE,批量大小选择64。部分超参数如表 1所示。
| 参数 | 设置 | 参数 | 设置 | |
| 卷积核大小 | 1×1 | 优化器 | Adam | |
| 卷积步长 | 1 | 损失函数 | MSE | |
| 激活函数 | ReLU | 批量大小 | 64 |
跟驰模型决策密切依赖历史驾驶行为,历史时间步长影响模型预测精度。对历史时间步长进行试验选择,确定最优历史时间步长和最优模型结构。首先固定模型结构,为节约训练时间,CNN与BiLSTM均采用单隐藏层、神经元个数为64的简单结构,分别对1,3,5,7,10 s的历史时间步长进行试验,以MSE为依据,确定最优时间步长,结果如图 8所示,最优时间步长为5 s,即为50步。
|
| 图 8 时间步长 Fig. 8 Time steps |
| |
对不同结构的模型进行试验,依据评价指标选取预测准确度最高的模型。在1层CNN时,卷积核数量为64;在2层CNN时,各层卷积核数量均为64;在3层CNN时,卷积核数量分别为64,64,128。BiLSTM每层单元数为64,具体设置如表 2所示。
| 层数 | CNN卷积核数量/个 | BiLSTM单元数/个 | ||
| 1 | — | — | 64 | 64 |
| 2 | — | 64 | 64 | 64 |
| 3 | 128 | 64 | 64 | 64 |
对不同结构模型进行试验,对比结果如表 3所示。由表 3不同模型结构可知,CNN层数为3、BiLSTM层数为2时,该模型的MAE与MSE最小,R2最大,确定为最佳模型结构。
| CNN层数 | BiLSTM层数 | MAE | R2 | MSE |
| 1 | 1 | 0.041 2 | 0.926 9 | 0.012 3 |
| 2 | 0.063 5 | 0.915 8 | 0.014 2 | |
| 3 | 0.041 0 | 0.924 3 | 0.012 7 | |
| 2 | 1 | 0.042 8 | 0.927 1 | 0.012 3 |
| 2 | 0.047 4 | 0.927 2 | 0.012 3 | |
| 3 | 0.040 9 | 0.925 9 | 0.012 5 | |
| 3 | 1 | 0.044 4 | 0.923 1 | 0.013 0 |
| 2 | 0.037 3 | 0.929 0 | 0.012 0 | |
| 3 | 0.043 2 | 0.926 3 | 0.012 4 |
3 实例验证分析
为验证基于CNN-BiLSTM-Attention的车辆跟驰模型的预测精度,分别选取数据驱动模型中的LSTM模型、GRU模型和CNN-BiLSTM模型进行对比分析。LSTM与GRU均设置2个隐藏层,每层64个神经元,其余参数设置均与CNN-BiLSTM-Attention保持相同。CNN-BiLSTM除不加Attention层外,其余参数设置均与CNN-BiLSTM-Attention保持相同。为保证公平性,模型输入与输出保持相同,评价指标为MAE,R2和MSE。以VehicleID为2061的预测数据为例,各模型对比效果如图 9所示。
|
| 图 9 模型预测对比 Fig. 9 Model prediction comparison |
| |
由图 9可知,LSTM与GRU在加速度剧烈变化时与测试值拟合效果较差,即预测效果较差,会出现较大误差的突变。CNN-LSTM模型与CNN-BiLSTM-Attention拟合效果较好,即可较好地预测加速度,且CNN-BiLSTM-Attention预测精度优于CNN-BiLSTM。由局部图可知,在加速度剧烈变化时,CNN-BiLSTM-Attention仍可以较好地预测,且预测精度优于其他模型。
由表 4可知,CNN-BiLSTM-Attention模型MAE与MSE最小,R2最大,即该模型对加速度预测精度最高,CNN-BiLSTM-Attention跟驰模型优于其他跟驰模型。与LSTM模型相比,MAE减少约38.12%,R2提高约2.18%, MSE减少约23.45%。与GRU模型相比,MAE减少约19.05%,R2提高约1.13%, MSE减少约13.95%,CNN-BiLSTM-Attention模型与单一模型相比,可更好地提取数据特征并处理历史数据间的关系,捕捉历史信息并做出相应决策。与CNN-BiLSTM模型相比,MAE减少约1.06%,R2提高约0.15%, MSE减少约1.78%,表明由于Attention机制突出重要输入特征部分,提高了模型的预测精度。
| 模型 | 评价指标 | ||
| MAE | R2 | MSE | |
| LSTM | 0.060 6 | 0.914 2 | 0.014 5 |
| GRU | 0.046 3 | 0.923 6 | 0.012 9 |
| CNN-BiLSTM | 0.037 9 | 0.932 6 | 0.011 3 |
| CNN-BiLSTM-Attention | 0.037 5 | 0.934 0 | 0.011 1 |
4 结论
本研究筛选了符合跟驰特性的车辆轨迹数据,经过数据降噪处理得到跟驰数据集。结合GM跟驰模型思想,将t时刻的后车速度vn+1(t)、两车t时的速度差Δv(t)与车间距Δx(t)作为输入,将下一时间间隔跟驰后车加速度an+1(t+Δt) 作为输出,构建了基于CNN-BiLSTM-Attention的车辆跟驰模型。通过试验确定最优模型结构,将所建立跟驰模型与LSTM跟驰模型、GRU跟驰模型与CNN-LSTM跟驰模型进行对比。结果表明,基于CNN-BiLSTM-Attention的车辆跟驰模型具有更高的预测精度。复杂的网络结构在保证高精度预测的同时,模型训练时间也随之变长,未来不断改进模型,实现在保证预测精度的同时,减少训练时间。未来可应用不同地区的轨迹数据训练模型,同时实现车辆轨迹预测。
| [1] |
PIPES L A. An Operational Analysis of Traffic Dynamics[J].
Journal of Applied Physics, 1953, 24(3): 274-281.
DOI:10.1063/1.1721265 |
| [2] |
GAZIS D C, HERMAN R, Potts R B. Car-following Theory of Steady-state Traffic Flow[J].
Operations Research, 1959, 7(4): 499-505.
DOI:10.1287/opre.7.4.499 |
| [3] |
GAZIS D C, HERMAN R, ROTHERY R W. Nonlinear Follow-the-leader Models of Traffic Flow[J].
Operations Research, 1961, 9(4): 545-567.
DOI:10.1287/opre.9.4.545 |
| [4] |
HELLY W. Simulation of Bottlenecks in Single-lane Traffic Flow[J].
Theory of Traffic Flow, 1959, 207-238.
|
| [5] |
JIANG R, WU Q, ZHU Z. Full Velocity Difference Modelfor a Car-following Theory[J].
Phys Rev E Stat Nonlin Soft Matter Phys, 2001, 64: 017101.
DOI:10.1103/PhysRevE.64.017101 |
| [6] |
HELBING D, HENNECKE A, SHVETSOV V, et al. Microand Macro-simulation of Freeway Traffic[J].
Mathematical and Computer Modelling, 2002, 35(5/6): 517-547.
|
| [7] |
GIPPS P G. A Behavioural Car-following Model for Computer Simulation[J].
Transportation Research Part B Methodological, 1981, 15(2): 105-111.
DOI:10.1016/0191-2615(81)90037-0 |
| [8] |
李娟, 曲大义, 刘聪, 等. 基于分子动力学的跟驰特性及其模型[J]. 公路交通科技, 2018, 35(3): 126-131. LI Juan, QU Da-yi, LIU Cong, et al. Car-following Characteristics and Its Models Based on Molecular Dynamics[J]. Journal of Highway and Transportation Research and Development, 2018, 35(3): 126-131. |
| [9] |
曲大义, 李娟, 刘聪, 等. 基于分子动力学的车流运行动态特性及其模型[J]. 交通运输系统工程与信息, 2017, 17(4): 188-194. QU Da-yi, LI Juan, LIU Cong, et al. Dynamic Characteristics Model of Traffic Flow Based on Molecular Dynamics[J]. Journal of Transportation Systems Engineering and Information Technology, 2017, 17(4): 188-194. |
| [10] |
KEHTARNAVAZ N, GROSWOLD N, MILLER K, et al. A Transportable Neural-network Approach to Autonomous Vehicle Following[J].
IEEE Transactions on Vehicular Technology, 1998, 47(2): 694-702.
DOI:10.1109/25.669106 |
| [11] |
贾洪飞, 隽志才, 王晓原. 基于神经网络的车辆跟驰模型的建立[J]. 公路交通科技, 2001, 18(4): 92-94. JIA Hong-fei, JUAN Zhi-cai, WANG Xiao-yuan. Development of a Car-following Model Based on Artificial Neural Networks[J]. Journal of Highway and Transportation Research and Development, 2001, 18(4): 92-94. |
| [12] |
WEI D, LIU H. Analysis of Asymmetric Driving Behavior Using a Self-learning Approach[J].
Transportation Research Part B: Methodological, 2013, 47: 1-14.
DOI:10.1016/j.trb.2012.09.003 |
| [13] |
ZHOU M, QU X, LI X. A Recurrent Neural Network Based Microscopic Car Following Modelto Predict Traffic Oscillation[J].
Transportation Research Part C: Emerging Technologies, 2017, 84: 245-264.
|
| [14] |
WANG X, JIANG R, LI L, et al. Capturing Car-following Behaviors by Deep Learning[J].
IEEE Transactions on Intelligent Transportation Systems, 2018, 19(3): 910-920.
|
| [15] |
HUANG X, SUN J, SUN J. A Car-following Model Considering Asymmetric Driving Behavior Based on Long Short-term Memory Neural Networks[J].
Transportation Research Part C: Emerging Technologies, 2018, 95: 346-362.
|
| [16] |
孙倩, 郭忠印. 基于长短期记忆神经网络方法的车辆跟驰模型[J]. 吉林大学学报(工学版), 2020, 50(4): 1380-1386. SUN Qian, GUO Zhong-yin. Vehicle Following Model Basedon Long Short-term Memory Neural Network[J]. Journal of Jilin University (Engineering and Technology Edition), 2020, 50(4): 1380-1386. |
| [17] |
费蓉, 刘方, 谢国, 等. 基于门控循环单元的车辆跟驰行为仿真模型[J]. 系统仿真学报, 2020, 32(10): 1862-1873. FEI Rong, LIU Fang, XIE Guo, et al. GRU-based Car-following Behavior Simulation Model[J]. Journal of System Simulation, 2020, 32(10): 1862-1873. |
| [18] |
崔宇, 侯慧娟, 胥明凯, 等. 基于双重注意力机制的变压器油中溶解气体预测模型[J]. 中国电机工程学报, 2020, 40(1): 338-347, 400. CUI Yu, HOU Hui-juan, XU Ming-kai, et al. A Prediction Method for Dissolved Gas in Power Transformer Oil Based on Dualstage Attention Mechanism[J]. Proceedings of the CSEE, 2020, 40(1): 338-347, 400. |
2023, Vol. 40


,