公路交通科技  2022, Vol. 39 Issue (1): 120-129

扩展功能

文章信息

陈王勇, 胡尧
CHEN Wang-yong, HU Yao
基于PELT的交通流状态检测与短期预测研究
Study on Traffic Flow State Detection and Short-term Prediction Based on PELT
公路交通科技, 2022, 39(1): 120-129
Journal of Highway and Transportation Research and Denelopment, 2022, 39(1): 120-129
10.3969/j.issn.1002-0268.2022.01.016

文章历史

收稿日期: 2020-10-09
基于PELT的交通流状态检测与短期预测研究
陈王勇1 , 胡尧1,2     
1. 贵州大学 数学与统计学院, 贵州 贵阳 550025;
2. 公共大数据国家重点实验室, 贵州 贵阳 550025
摘要: 为了更加精准实时地发布道路交通状态以及交通流趋势预警,基于动态规划和剪枝技术的PELT变点检测方法,针对卡口数据进行交通流状态检测与短期预测研究。首先,对于交通流近平稳状态的检测,结合时间序列的ADF检验构建了交通流近平稳状态检测方法。该方法能够快速准确地将断面交通流序列划分为多个可能接近平稳状态的候选间隔,接着对每个候选间隔进行ADF检验,在给定显著性水平下判别候选间隔是否平稳,进而检测出交通流序列中的近平稳状态。其次,对于交通流的短期预测,在PELT变点检测基础上将局部多项式回归与Sigma原则结合,得到短期断面交通流趋势预测区间。再次,为了探究局部多项式回归方法的预测效果,在模拟研究中,将其与LOESS和k近邻回归方法进行比较。最后,以贵阳市每2 min交通卡口车流量数据为例,运用所提方法检测近平稳状态并进行短期交通流趋势预测。结果表明:局部多项式回归方法在可决系数和均方根误差两个评价指标下均表现较优;所提方法对于交通流近平稳状态的检测具有有效性;对于短期断面交通流趋势的预测,预测区间趋势与观测时序基本吻合,且交通流趋势预测区间覆盖率高达80%,进一步说明所提预测方法具有一定的时效性和有效性。
关键词: 城市交通     交通流短期预测     变点检测     卡口数据     非参数回归     交通状态检测    
Study on Traffic Flow State Detection and Short-term Prediction Based on PELT
CHEN Wang-yong1, HU Yao1,2    
1. School of Mathematics and Statistics, Guizhou University, Guiyang Guizhou 550025, China;
2. State Key Laboratory of Public Big Data, Guiyang Guizhou 550025, China
Abstract: In order to issue road traffic state and traffic flow trend warnings more accurately and in real time, the Pruned Exact Linear Time (PELT) changepoint detection method based on dynamic programming and pruning technology is used for the study on traffic flow state detection and short-term prediction based on bayonet data. First, for the detection of the near-stationary state of traffic flow, the method for detecting near-stationary state of traffic flow is constructed combining with Augmented Dickey-Fuller (ADF) test for time series. This method can quickly and accurately divide the cross-section traffic flow sequence into multiple candidate intervals that may be close to a stationary state, then performs ADF test on each candidate interval, judges whether the candidate interval is stable under the given significance level, and then detects the near-stationary state in the traffic flow sequence. Second, for the short-term prediction of traffic flow, on the basis of the PELT changepoint detection, combining local polynomial regression with the Sigma principle, the short-term section traffic flow trend prediction interval is obtained. Third, in order to explore the prediction effect of the local polynomial regression method, it is compared with the Locally Weighted Regression and Smoothing Scatterplot (LOESS) and k-nearest neighbor regression method in the simulation study. Finally, taking the traffic volume data of the traffic bayonet every 2 minutes in Guiyang City for example, the near-stationary state is detected and the short-term traffic flow trend is predicted by the proposed method. The result shows that (1) the local polynomial regression method performs better under the evaluation indicators of coefficient of determination and root mean square error; (2) the proposed method is effective for detecting the near-stationary traffic flow; (3) for the prediction of short-term traffic flow trend, the prediction interval trend is basically consistent with the observation sequence, and the coverage rate of the traffic flow trend prediction interval is as high as 80%, which further explained that the proposed prediction method has certain timeliness and effectiveness.
Key words: urban traffic     traffic flow short-term prediction     changepoint detection     bayonet data     nonparametric regression     traffic state detection    
0 引言

在很多交通流状态分析研究中,高峰期存在平稳状态都是一个潜在的假设。而近平稳状态的识别对于检测交通活动瓶颈,校准基本图以及量化容量变化的幅度大小具有重要意义。Jin近年的一系列研究中,在运动波理论框架内证明了一般道路网络中平稳状态的存在和稳定性[1-3]。然而,由于不可避免的噪声干扰和随机波动,原始检测数据中不存在严格的平稳状态,因此,在实践中平稳状态只能是近似平稳的。

现有的识别此类近平稳状态的研究通常是由校准基本图的需要所推动的。Del Castillo等[4]提出潜在的近平稳状态持续时间至少4或5 min且标准差小于平均值的15%,基于此准则对速度序列进行目视选择,进一步基于Kendall’s tau检验,提取速度和车辆计数序列中无趋势的近平稳状态。由于上述方法使用目视检查,并且在处理大量数据时耗费时间和人力。因此,需要有效识别近平稳状态的自动方法。最近Yan等[5]基于PELT(Pruned Exact Linear Time)搜索算法的变点检测方法,将交通流时间序列划分为多个可能接近平稳状态的候选间隔,计算每个候选间隔的特征,通过修改Cassidy准则实现了近平稳状态的自动识别过程,但是对数据要求较为苛刻。邬群勇等[6]基于公交车和出租车轨迹数据对城市交通状态进行了精细划分和识别,实现对城市交通状态的分析。本研究在文献[5]的基础上,提出随机化的交通流基本参数,根据不同的速度和密度需求,精细划分交通状态,并结合时间序列方法,运用ADF(Augmented Dickey-Fuller)检验[7]构建交通流近平稳状态检测方法。

在智能交通系统的研究领域中,除了上述交通状态检测研究外,短期交通流预测也是研究的热点之一[8-12]。而非参数回归方法在交通流预测中扮演着重要的角色[13],早期Sun等[14]提出局部线性回归模型应用于短期交通预测,该方法具有一定的时效性,但是对带有异常值的数据不具有鲁棒性。进而Cleveland[15]提出具有鲁棒性的LOESS(Locally Weighted Regression and Smoothing Scatterplot)方法,通过计算和绘制平滑点,大大增强了散点图上的视觉信息。Sun等[16]提出具有鲁棒性的自适应参数的k近邻方法用于短期交通流预测,但交通流历史信息考虑不足。对此,本研究引入局部多项式回归[17],并综合考虑当前的交通流信息以及历史交通流消息,对未来的交通流进行短期预测。基于PELT搜索算法,结合Sigma原则,得到短期断面交通流趋势预测区间。

本研究内容安排如下:首先定义划分交通流状态,接着构建基于PELT搜索算法的交通流变点检测方法以及近平稳状态的检测模型,引入局部多项式回归方法,并与LOESS,k近邻等非参数回归方法进行预测精度的比较,最后以实际交通流数据验证所提方法的有效性。

1 交通流近平稳状态检测模型 1.1 交通流状态

在时空区域Ω={(t, l): tT, lL}中,交通流率、密度、速度在时刻t位置l处分别记为q(t, l),k(t, l)以及v(t, l),则有如下状态:

定义1若时空域中的流率和密度均与时间无关q(t, l)=q(l),k(t, l)=k(l)或等价地表示为:

(1)

则称该时空区域中的交通流状态是平稳的(stationary state)[5]

定义2若时空域中的流率和密度均与时间和位置无关q(t, l)=qk(t, l)=k,或等价地表示为:

(2)

则称该时空区域中的交通流状态是稳定的(steady state)[5]

根据交通守恒定律:,有, (t, l)∈Ω。进而可知平稳状态下的流率是一个常量且速度与时间无关,而在稳定状态下的速度也是一个常量。从定义可以看出:一个稳定状态总是平稳的,但一个平稳的状态可能不是稳定的。然而,由于不可避免的噪声和波动,原始检测数据中不存在严格的平稳或稳定状态。因此,在实践中平稳或稳定状态只能是近似平稳的。

在上述的定义中,并没有考虑交通流基本参数的随机特征。在实际中,由于道路交通运行复杂,交通数据更是异构多源,时空性明显,且交通状态是交通运行系统中不同通行能力供需变化的综合体现,故本研究将从统计角度随机意义下去划分交通状态,即将时空区域Ω中的流量Q(t, l)、密度K(t, l) 以及速度V(t, l)均映射到实数域R。在统计意义下,将通行能力记为交通流量条件期望最大值,其基本计算公式如下:

(3)

进而通行能力C是关于速度V(t, l)的函数,其中分别为通行能力对应的密度和速度估计值。在给定置信水平下,速度的置信上限和置信下限分别记为Δvsup和Δvinf,密度的置信上限和置信下限分别记为Δksup和Δkinf,则根据不同的需求速度V划分自由流(freeflow)、中断(traffic breakdown)以及拥堵(congestion)等交通状态如下:

自由流,中断,拥堵,其中vf为自由流速度。在给定置信水平下,按交通流两参数随机划分自由流、中断和拥堵等交通状态,对应状态分别如下:

(4)

式中kj为交通阻塞密度(jam density)。

综上可知,统计意义下定义的自由流、中断和拥堵等交通状态中均存在近平稳状态。本研究旨在研究交通流量参数近似常数下的一种近平稳状态检测以及交通流的短期预测。

1.2 基于PELT搜索算法的交通流变点检测模型

数据预处理:记表示观测到的交通流序列,其中n是样本量。采用如下公式对交通流序列进行标准化处理,使其平均值为0,标准差为1。

(5)

式中,sq分别为交通流序列的平均值和标准差;为时刻i处标准化的交通流观测值。交通流变点本质上是交通流模型中的某个或某些参数起突然变化的点[18]。这种变化可能由交通流的异常状态所引起,也有可能是车辆故障、自然灾害、交通事故等异常现象导致的车流合并或交通阻塞所引起[19]

假设有多个变点m存在于标准化的交通流序列中,并且变点的有序位置记为τ1:m=(τ1,…, τm),m是介于1和n-1之间的整数。边界变点位置分别记为τ0τn。因此,将数据流序列划分为m+1个间隔。在间隔j中标准化的交通流序列表示为。且满足假设:

为了检测变点数量和位置,构造如下优化问题:

(6)

式中,θ为间隔的损失函数;β为避免过度拟合的惩罚参数[20]。特别地,使用两倍的负对数似然函数来表示损失函数:

(7)

式中,为未知且固定不变;的MLE(极大似然估计)是

对于式(7)中的第1项可以去掉,因为它在两个连续变点位置之间的差是线性的,且代入式(6)后变为常数。此外,可以通过适当调整β来去除第2项的系数,因为它不会影响任何选择的最优分配。因此式(7)可等价为:

(8)

进而得到交通流标准化序列的目标函数:

(9)

式中,β采用修正的BIC准则[21]

为了求解上述的最优问题和寻找最优的变点位置,采用基于动态规划和剪枝技术的PELP算法得到交通流标准化序列中检测的最优变点位置:

(10)

定理: 通过样本标准差重新调整惩罚参数,数据标准化不影响观测序列中检测到的变点数量和位置。

证明:将(5)式代入标准化序列的目标函数(9)式中可得:

(11)

式中β′=soβ为校准后的惩罚参数。由于so-1是一个非负常数,故式(11)可被视为惩罚为β′的观测序列的一个目标函数,由此检测到的变点数量和位置与标准化序列中的变点完全相同。

定理表明适当的惩罚参数选择说明式(10)也是交通流观测序列的最优变点位置。

1.3 近平稳状态检测模型

存在m个变点的交通流序列中,检测的最优变点位置为:。进而将交通流序列划分为m+1个候选间隔。对第j个候选间隔中包含的交通流时序数据有如下常数均值、无趋势的AR(p)检测模型:

(12)

式中,i.i.d.为独立同分布;p为模型的阶数;εt为噪声;σε2εt所服从分布的方差。

若交通流序列{qt}平稳,则

若交通流序列{qt}非平稳,则

,则AR(p)过程的ADF检验原假设和备择假设如下:

(13)

构造ADF检验统计量[7],式中为参数的样本标准差。在给定显著性水平α下,记γα为ADF检验统计量的α分位数,由于ADF检验为单边检验,则:

γγα时,拒绝原假设H0,认为序列{qt}显著平稳,即第j个候选间隔为近平稳状态;

γγα时,接受原假设H0,认为序列{qt}非平稳,即第j个候选间隔为非近平稳状态。

2 交通流短期预测方法 2.1 局部多项式回归

针对交通流序列,除了对交通状态的检测外,还需要根据当前的历史数据对未来的交通流趋势做出判断。本研究采用局部多项式回归[17]对交通流时间序列进行短期预测。该方法是一种基于光滑思想的非参数回归模型,记观测到的一组样本数据为(ti, qi)(i=1,…n),则可建立如下非参数模型:

(14)

式中,m(t)=E(q|t)为q关于t的回归函数,并进一步假定E(εi)=0,Var(εi)=σ2。局部多项式基于加权最小二乘的思想,利用k(k≥1)阶多项式去逼近回归函数。

Q=(q1,…, qn)TT(t0)=((ti-t0)j), i=1,…, n, j=0,…, k。设m(t)具有k阶连续导数,对定义域中任一点t0,进行Taylor展开,则在t0的邻域内有:

(15)

式中,αj(t0)=m(j)(t0)/j!(j=0, 1,…, k),选择合适的αj(t0)(j=0, 1,…, k)使得式(16)达到最小

(16)

式中,为Gauss核光滑函数;h为光滑参数。

W(t0)=Diag(Kh(t1-t0),…, Kh(tn-t0)),α(t0)=(α0(t0),…, αk(t0))T,则由加权最小二乘方法可得α(t0)的估计值为:

(17)

进而点t0处回归函数的估计值为,式中ej+1为第j+1个元素为1,其余元素为0的k+1维列向量。若让t0分别取t1, t2…, tn,则各点处的回归函数估计值即为qi的拟合值,简记为,令为拟合值向量,则有

(18)

给定光滑参数h,则拟合值向量为。积分均方误差准则下的最优光滑参数。记T=(t1,…, tn),对于0≤jk,令

(19)

式中ω(t)为非负的权函数,则最优光滑参数为:

(20)
2.2 模拟和预测比较

为了评价上述方法的预测效果,本研究采用均方根误差RMSE(Root Mean Square Error)和可决系数(Coefficient of Determination)R2两个指标来衡量预测的精度[22-23]。可决系数R2越接近于1,说明模型的预测效果越好;而均方根误差RMSE越小,说明模型的预测精度越高。记yi(i=1,…, n)为观测序列;为对应的预测值;y为观测序列平均值,则指标计算公式如下:

(21)
(22)

为了说明局部多项式回归的有效性,本研究将该方法与LOESS,k近邻等经典的非参数回归方法进行比较。在k近邻回归中,k取值过小会出现过拟合现象,而k取值过大会出现欠拟合现象,为防止过拟合或欠拟合本研究k取3和6。首先通过模拟基准[24]来检测方法的性能,其次基于贵阳市中山西路与瑞金中路交叉口(由南往北方向)2 min断面交通流数据,通过上述回归方法分别进行短期预测,进一步验证该方法的有效性。模拟数据由如下模型产生:

(23)

其中数据长度n=500,噪声参数σ=0.2。数据中共存在6个均值变点,变点位置依次为137,224,241,298,307,331各个区段均值μ依次为-0.18,0.36,0.89,-0.4,0.29,-0.65,0.33, 如图 1所示。

图 1 模拟数据示例 Fig. 1 Example of simulated data

在积分均方误差准则下局部多项式回归的最优光滑参数如图 2所示。从图 2中可以看出,模拟数据的积分均方误差MISE在光滑度h为2.6时达到最小值;而断面流量数据的积分均方误差MISE在光滑度h为1.1时达到最小,故局部多项式的最优光滑参数分别选取为2.6和1.1。

图 2 局部多项式回归光滑参数的选取 Fig. 2 Selection of local polynomial regression smoothing parameters

基于模拟数据和断面流量数据,将局部多项式回归与LOESS,k近邻等经典的非参数回归方法进行比较如图 3图 4所示。从图 3图 4中均可以看出LOESS方法只是大致拟合了数据的趋势,与观测时序趋势相差较大,不便于做实际分析; 而局部多项式回归与k近邻回归拟合效果相对较优,拟合时序和观测值序列趋势基本吻合。

图 3 局部多项式、LOESS及k近邻回归方法比较 Fig. 3 Comparison of local polynomial, LOESS and k-nearest neighbor regression method

图 4 局部多项式回归、LOESS及k近邻回归预测比较 Fig. 4 Comparison of local polynomial regression, LOESS, and k-nearest neighbor regression prediction

通过比较得到各个方法的精度评价指标见表 1。从表 1中可以看出局部多项式回归在两个精度指标可决系数R2和均方根误差RMSE方面均表现较优。一方面基于模拟数据局部多项式、k近邻(k=3)和k近邻(k=6)的可决系数R2以及RMSE相对于LOESS较高,且局部多项式回归的R2RMSE较优,分别为0.926 5和0.894 8,进而说明了局部多项式回归方法的有效性。另一方面基于交通流数据局部多项式回归预测值与观测值的可决系数R2为0.894 8,均方根误差RMSE为11.088 6,相对于LOESS和k近邻回归方法较优,进一步验证了该方法的有效性。

表 1 精度指标比较 Tab. 1 Comparison of precision indicators
回归方法 R2 RMSE
模拟数据 交通流数据 模拟数据 交通流数据
局部多项式 0.926 5 0.894 8 0.151 8 11.088 6
LOESS 0.783 0 0.851 0 0.250 8 13.203 8
k近邻(k=3) 0.914 1 0.894 8 0.162 8 11.114 0
k近邻(k=6) 0.897 9 0.894 2 0.177 1 11.135 8

3 案例分析 3.1 交通流近平稳状态检测

主要选取贵阳市中山西路与瑞金中路(由南往北方向)、中华南路与都司路(由北往南方向)两个交叉口的断面交通流为研究对象,分别将其记为断面I和断面II。为检测所选断面交通流的近平稳状态以及断面交通流短期预测,特取7月1日—7月7日为期1周的2 min断面交通流数据如图 5所示,从图 5可以看出在07:00与23:00之间的时段内两个断面的交通流量相对较高,其余时段相对较低,特别在23:00与00:00之间的时段内数据存在不同程度的缺失或异常值,造成该时段内的近平稳状态检测结果、断面交通流量预测与实际不符, 见图 4图 6图 8所示。

图 5 断面I和断面II交通流量热力图 Fig. 5 Thermal diagrams of traffic volumes at section I and section II

图 6 断面I和断面II近平稳状态候选间隔 Fig. 6 Near-stationary state candidate intervals of section I and section II

图 7 累计车流量原始曲线和转换曲线 Fig. 7 Original and transformed curves of cumulative traffic volume

图 8 7月7日短期断面交通流趋势预测 Fig. 8 Cross-sectional short-term traffic flow trend prediction on July 7

为检测出所选断面处的交通流近平稳状态,采用基于动态规划和剪枝技术的PELP算法对断面交通流序列进行候选间隔的划分如图 6所示,图 6(a)(b)中仅显示了7月1日—7月4日的近平稳状态候选间隔,并对所划分的候选间隔进行编号。针对断面I和断面II为期1周的交通流量序列共划分出131个候选间隔,其中断面I包含56个候选间隔,断面II包含75个候选间隔。对所有候选间隔进行ADF检验,将ADF值严格小于0且p值不超过显著性水平0.01的候选间隔视为近平稳状态,共检测出55个近平稳状态,其中断面I包含28个近平稳状态,断面II包含27个近平稳状态。

例如,7月2日断面I与断面II候选间隔状态检测结果见表 2。对于检测出的非平稳状态,其对应时段内的断面流量会出现较大的波动,更容易导致交通事故的发生,具体需结合多源交通流数据做进一步排查,该检测结果对道路交通管理具有一定的有效性。

表 2 7月2日断面I与断面II候选间隔状态检测结果 Tab. 2 Test result of candidate interval between section I and section II on July 2
候选间隔ID 断面I 断面II
时段 ADF值 p 状态 时段 ADF值 p 状态
1 [00:00, 01:46) -3.60 0.01 平稳 [00:00, 01:52) -3.68 0.01 平稳
2 [01:46, 03:22) -2.74 0.08 非平稳 [01:52, 03:54) -4.04 0.01 平稳
3 [03:22, 06:24) -3.62 0.01 平稳 [03:54, 05:52) -3.11 0.03 非平稳
4 [06:24, 06:58) -1.42 0.53 非平稳 [05:52, 06:34) -3.99 0.01 平稳
5 [06:58, 07:56) -2.75 0.08 非平稳 [06:34, 07:44) -3.36 0.02 非平稳
6 [07:56, 09:50) -3.70 0.01 平稳 [07:44, 09:54) -3.06 0.04 非平稳
7 [09:50, 18:16) -9.07 0.01 平稳 [09:54, 18:26) -7.99 0.01 平稳
8 [18:16, 22:22) -3.27 0.02 非平稳 [18:26, 19:42) -4.04 0.01 平稳
9 [22:22, 22:58) -3.86 0.01 平稳 [19:42, 23:58) -4.25 0.01 平稳
10 [22:58, 23:58) -0.19 0.96 非平稳

3.2 近平稳状态的验证

根据Cassidy提出的目视检测方法[25]对近平稳状态有效性进行直接验证,记N(t, l)为t时刻到达位置l的累计车流量,q0t为时间的线性函数,q0是与候选间隔有关的常数,若N(t, l)-q0t关于时间t具有线性趋势且与最佳拟合线之间的偏差不超过10辆-1,则该候选间隔可以视为近平稳状态。为说明上述所检测出的近平稳状态是有效的,以7月2日断面II时段[05:52, 09:54]为例,该时段共划分了3个候选间隔,累计车流量的原始曲线N(t, l)和转换曲线N(t, l)-q0t图 7所示。从图 7中可以直观的看出:第4个候选间隔不仅具有明显的线性趋势且均在拟合线阈值边界内,所以该候选间隔视为近平稳状态是有效的; 注意到第5个和第6个候选间隔没有被选为近平稳状态,很大程度上是因为累计车流量转换曲线超出拟合线阈值边界。这与表 2中断面II的近平稳状态检测结果是一致的,即上述所构建的交通流近平稳状态检测方法是有效的。

3.3 交通流短期预测

除了对断面交通流进行状态检测外,为了提高道路的交通流趋势预警,在PELT变点检测算法的基础上将局部多项式回归与Sigma原则结合,得到短期断面交通流趋势预测区间。

对于存在m个变点的断面交通流序列,由PELT算法得到m+1个时段。对第j个时段中包含的断面交通流数据qτj-1+1,…, qτj(j=1,…, m+1),定义断面交通流趋势预测区间:, j=1,…, m+1, i=τj-1+1,…, τj,式中,τj为变点位置;为局部多项式回归预测值;为标准差估计值。采用预测区间覆盖率(Coverage Ratio,CR)来评价预测方法的性能[19],计算公式如下:

(24)

式中,n为预测样本量;I(·)为示性函数。

以7月1日—7月6日的断面交通流数据为测试集,基于测试集数据采用上述局部多项式回归,得到7月7日的短期断面交通流趋势预测如图 8所示,从图 8中可以看出部分时段的交通流量会出现较大的波动,整体上预测区间趋势与观测时序基本吻合。以断面I的预测趋势为例,如图 8(a)在时段[06:00, 08:30)内共检测出5个变点,变点位置依次为06:24,06:42,07:00,07:18,08:18对应的断面流量预测值分别为11,27,42,61,65。相对于流量趋势较为平稳的时段[00:00, 06:00)而言,在该时段内流量呈现急剧上升趋势。一方面,若提前对出行者发布该断面处的交通流量趋势,则在某种程度上对出行者的路线选择提供便利,同时也有利于交管部门对该断面及时进行交通疏导,缓解交通拥堵,说明上述的短期断面交通流趋势预测区间具有一定的时效性;另一方面,断面I、断面II的交通流量趋势预测区间覆盖率分别为82.92%,80.28%,可见预测区间覆盖率较高,进一步说明了上述预测方法具有一定的有效性。

4 结论

针对目前的交通流基本参数,考虑时空特征,从统计角度随机化交通流基本参数,同时给出了相应的自由流、中断和拥堵等交通状态划分,通过分析表明近平稳状态存在于3种状态之中。针对卡口数据构建了交通流近平稳状态的检测方法。该方法能够快速准确地检测断面交通流候选间隔是否为交通流近平稳状态,并基于贵阳市实际交通流数据通过Cassidy目视检测方法验证了所提方法的有效性。除了对断面交通流进行状态检测外,为了提高道路的短期交通流趋势预警,引入局部多项式回归,对断面交通流趋势进行短期预测。通过模拟和预测精度指标比较分析表明,该方法相对于经典的LOESS以及k近邻等非参数回归方法在预测精度方面表现较优。除此之外,通过实证分析表明短期断面交通流趋势预测区间与观测时序的趋势基本吻合,且交通流趋势预测区间的覆盖率较高。综合考虑交通流近平稳状态检测结果和交通流趋势预测结果,对于出行者的路线选择、交通拥堵的缓解以及交管部门的决策提供了一定的参考价值。同时为道路交叉口及城市路网中交通流近平稳状态的自动检测提供了方法参考。

所提方法不足之处在于PELT变点检测方法不仅要求数据服从正态分布,而且易受异常值的影响。在分布假设不正确或异常值存在的情况下,可能会影响时序的划分,进一步影响检测的近平稳状态数量和质量。因此在后续研究中可以考虑一些稳健的时序划分方法,来增强近平稳状态检测方法对异常值的稳健性。另外,在接下来的工作中将通过基本图对多时段、多断面交通流数据进行精细划分交通状态以及多断面交通流短期预测方法的研究。

参考文献
[1]
JIN W L. Continuous Kinematic Wave Models of Merging Traffic Flow[J]. Transportation Research Part B: Methodological, 2010, 44(8): 1084-1103.
[2]
JIN W L. On the Existence of Stationary States in General Road Networks[J]. Transportation Research Part B: Methodological, 2015, 81(3): 917-929.
[3]
JIN W L. On the Equivalence between Continuum and Car-following Models of Traffic Flow[J]. Transportation Research Part B: Methodological, 2016, 93(11): 543-559.
[4]
DEL CASTILLO J M, BENITEZ F G. On the Functional Form of the Speed-density Relationship-II: Empirical Investigation[J]. Transportation Research Part B: Methodological, 1995, 29(5): 391-406.
[5]
YAN Q L, SUN Z, GAN Q J, et al. Automatic Identification of Near-stationary Traffic States Based on the PELT Changepoint Detection[J]. Transportation Research Part B: Methodological, 2018, 108(2): 39-54.
[6]
邬群勇, 胡振华, 张红. 基于多源轨迹数据的城市交通状态精细划分与识别[J]. 交通运输系统工程与信息, 2020, 20(1): 83-90.
WU Qun-yong, HU Zhen-hua, ZHANG Hong. Fine Division and Identification of Urban Traffic Status Based on Multi-source Trajectory Data[J]. Journal of Transportation Systems Engineering and Information Technology, 2020, 20(1): 83-90.
[7]
PAPARODITIS E, POLITIS D N. The Asymptotic Size and Power of the Augmented Dickey-fuller Test for a Unit Root[R]. San Diego: University of California at San Diego, 2013.
[8]
万玉龙, 李新春, 周红标. 基于WPD-PSO-ESN的短期交通流预测[J]. 公路交通科技, 2019, 36(8): 144-151.
WAN Yu-long, LI Xin-chun, ZHOU Hong-biao. Prediction of Short-term Traffic Flow Based on WPD-PSO-ESN[J]. Journal of Highway and Transportation Research and Development, 2019, 36(8): 144-151.
[9]
唐智慧, 郑伟皓, 董维, 等. 基于交互式BP-UKF模型的短时交通流预测方法[J]. 公路交通科技, 2019, 36(4): 117-124, 134.
TANG Zhi-hui, ZHENG Wei-hao, DONG Wei, et al. A Method for Predicting Short-term Traffic Flow Based on Interactive IMM-BP-UKF Model[J]. Journal of Highway and Transportation Research and Development, 2019, 36(4): 117-124.
[10]
杨正理, 陈海霞, 王长鹏, 等. 大数据背景下城市短时交通流预测[J]. 公路交通科技, 2019, 36(2): 136-143.
YANG Zheng-li, CHEN Hai-xia, WANG Chang-peng, et al. Urban Short-term Traffic Flow Forecasting with Big Data[J]. Journal of Highway and Transportation Research and Development, 2019, 36(2): 136-143.
[11]
吴晋武, 张海峰, 冉旭东. 基于数据约减和支持向量机的非参数回归短时交通流预测算法[J]. 公路交通科技, 2020, 37(7): 129-134.
WU Jin-wu, ZHANG Hai-feng, RAN Xu-dong. Nonparametric Regressive Short-term Traffic Flow Forecast Algorithm Based on Data Reduction and SVM[J]. Journal of Highway and Transportation Research and Development, 2020, 37(7): 129-134.
[12]
杨春霞, 秦家鹏, 王庆, 等. 基于多车道加权融合的短时交通流预测研究[J]. 公路交通科技, 2021, 38(1): 121-127.
YANG Chun-xia, QIN Jia-peng, WANG Qing, et al. Study on Short-term Traffic Flow Prediction Based on Multi-lane Weighted Fusion[J]. Journal of Highway and Transportation Research and Development, 2021, 38(1): 121-127.
[13]
XU D W, WANG Y D, PENG P, et al. Real-time Road Traffic State Prediction Based on Kernel-KNN[J]. Transportmetrica A: Transport Science, 2020, 16(1): 104-118.
[14]
SUN H Y, LIU H X, XIAO H, et al. Use of Local Linear Regression Model for Short-term Traffic Forecasting[J]. Transportation Research Record, 2003, 1836: 143-150.
[15]
CLEVELAND W S. Robust Locally Weighted Regression and Smoothing Scatterplots[J]. Journal of the American Statistical Association, 1979, 74(368): 829-836.
[16]
SUN B, CHENG W, GOSWAMI P, et al. Short-term Traffic Forecasting Using Self-adjusting k-nearest Neighbours[J]. IET Intelligent Transport Systems, 2018, 12(1): 41-48.
[17]
CHEN G Q, LONG T Y, BAI Y, et al. A Forecasting Framework Based on Kalman Filter Integrated Multivariate Local Polynomial Regression: Application to Urban Water Demand[J]. Neural Processing Letters, 2019, 50(1): 497-513.
[18]
王晓原, 隽志才, 贾洪飞, 等. 交通流突变分析的变点统计方法研究[J]. 中国公路学报, 2002, 15(4): 69-74.
WANG Xiao-yuan, JUAN Zhi-cai, JIA Hong-fei, et al. Study of a Statistical Method of Change-point to Analyze Traffic Flow Breakdown[J]. China Journal of Highway and Transport, 2002, 15(4): 69-74.
[19]
商明菊. 基于FPOP的交通流变点检测应用研究[D]. 贵阳: 贵州大学, 2019.
SHANG Ming-ju. Application Research of Detecting Changepoint of Traffic Flow Based on FPOP[D]. Guiyang: Guizhou University, 2019.
[20]
MAIDSTONE R, HOCKING T, RIGAILL G, et al. On Optimal Multiple Changepoint Algorithms for Large Data[J]. Statistics and Computing, 2017, 27(2): 519-533.
[21]
ZHANG N R, SIEGMUND D O. A Modified Bayes Information Criterion with Applications to the Analysis of Comparative Genomic Hybridization Data[J]. Biometrics, 2007, 63(1): 22-32.
[22]
刘小明, 田玉林, 唐少虎, 等. 基于时延特性建模的多断面短时交通流预测[J]. 交通运输系统工程与信息, 2020, 20(3): 54-60.
LIU Xiao-ming, TIAN Yu-lin, TANG Shao-hu, et al. Short-term Traffic Flow Prediction of Multi-sections Based on Time-delay Modeling[J]. Journal of Transportation Systems Engineering and Information Technology, 2020, 20(3): 54-60.
[23]
ARTHUR C K, TEMENG V A, ZIGGAH Y Y. Novel Approach to Predicting Blast-induced Ground Vibration Using Gaussian Process Regression[J]. Engineering with Computers, 2020, 36: 29-42.
[24]
FRICK K, MUNK A, SIELING H, et al. Multiscale Change Point Inference[J]. Journal of the Royal Statistical Society Series B: Statistical Methodology, 2014, 76(3): 495-580.
[25]
CASSIDY M J. Bivariate Relations in Nearly Stationary Highway Traffic[J]. Transportation Research Part B: Methodological, 1998, 32(1): 49-59.