公路交通科技  2023, Vol. 40 Issue (5): 237-246

扩展功能

文章信息

李志强, 陈来荣, 刘冬梅, 赵琳.
LI Zhi-qiang, CHEN Lai-rong, LIU Dong-mei, ZHAO Lin
疫情防控措施影响下的春运客运量预测方法研究
Study on Prediction Method of Passenger Volume of Spring Festival Transport under Influence of Epidemic Prevention and Control Measures
公路交通科技, 2023, 40(5): 237-246
Journal of Highway and Transportation Research and Denelopment, 2023, 40(5): 237-246
10.3969/j.issn.1002-0268.2023.05.031

文章历史

收稿日期: 2022-08-11
疫情防控措施影响下的春运客运量预测方法研究
李志强1 , 陈来荣1 , 刘冬梅2 , 赵琳2     
1. 北京林业大学 工学院, 北京 100083;
2. 综合交通运输大数据处理及应用技术行业研发中心 (中路高科), 北京 100088
摘要: 针对春运期间的大客流集中出行场景, 精准的客流量预测对于交通运输行业管理部门科学研判客流趋势特点和做好疫情防控工作具有重要意义。以历年春运期间铁路、道路、水运、航空多方式客流量数据为基础, 结合手机信令数据的人口出行规律监测数据, 充分挖掘了历史数据的动态变化规律, 提取了节假日、非节假日、疫情防控措施对客流量的影响, 并进行了相应的特征标签标记, 基于LSTM算法构建了全国各运输方式日客流量预测模型。综合考虑学生、农民工等典型出行群体春节前返乡、春节后返程等时空分布规律特征, 采用"15+25"拼接组合的方式提出了在疫情常态化防控措施影响下的各方式春运客流量双层平行长短期记忆神经网络预测方法。以2022年春运40 d全国客流量为例, 分别从春运日客运量和春运客运总量2个角度进行分析, 对本方法进行了试算, 并与岭回归(RR)模型、支持向量机(SVM)模型、门循环单元(GRU)模型3种常见预测模型的预测结果进行了对比。结果表明: 双层平行长短期记忆神经网络预测方法对春运日客运量预测的平均绝对百分比误差在7%~17%之内, 对春运客运总量预测的平均绝对百分比误差在7%以内。模型精度高于其他预测模型, 对研究分析重大公共突发事件下的客流量预测具有借鉴意义。
关键词: 运输经济    客运量预测    深度学习    长短期记忆神经网络    时间序列    
Study on Prediction Method of Passenger Volume of Spring Festival Transport under Influence of Epidemic Prevention and Control Measures
LI Zhi-qiang1, CHEN Lai-rong1, LIU Dong-mei2, ZHAO Lin2    
1. School of Technology, Beijing Forestry University, Beijing 100083, China;
2. R&D Center of Transport Big Data Processing Technologies and Application for Comprehensive Transport of Transport Industry(RIOH-HSTG), Beijing 100088, China
Abstract: Accurate passenger volume prediction is of great significance for transport industry management departments to scientifically analyze the characteristics of passenger flow trends and carry out epidemic prevention and control work in response to the concentrated travel scenario of large passenger flow during the Spring Festival transport period. Based on the passenger volume data of railways, roads, waterways and airlines during the Spring Festival transport period over the years, combining with the monitoring data of population travel patterns from mobile signaling data, the dynamic changes in historical data are fully explored, the influences of of holiday, non holiday, and epidemic prevention and control measures on passenger volume are extracted, the corresponding feature labels are labeled, and a daily passenger volume prediction model for different transport modes in China is constructed based on the LSTM algorithm. Considering the spatio-temporal distribution characteristics of typical travel groups such as students and migrant workers returning home before Spring Festival and reworking after Spring Festival, a double-layer parallel long-term and short-term memory(LSTM) neural network prediction method for the passenger volume of Spring Festival travel under the influence of epidemic normalization prevention and control measures is proposed by using the "15+25 combination method. Taking the 40 days' national passenger volume of the 2022 Spring Festival transport for example, the proposed method is analyzed and tested from the perspectives of daily passenger volume and total passenger volume of Spring Festival transport, and the prediction result is compared with those of 3 common prediction models (Ridge Regression model, Support Vector Machine model, and Gate Recurrent Unit model. The result shows that the average absolute percentage errors of the double-layer parallel long-term and short-term memory neural network prediction method for daily and total passenger traffic volumes of Spring Festival transport is within 7%-17% and within 7% respectively. The accuracy of the model is higher than those of other prediction models, which has reference significance for studying and analyzing passenger volume prediction under major public emergencies.
Key words: transport economics    passenger volume prediction    deep learning    LSTM neural network    time series    
0 引言

春运是具有中国特色的大规模客流迁徙,春运大客流的有序流动是对交通运输管理能力的考验,也是人民满意交通的重要体现。受新冠疫情影响,春运客流近3 a有所下降,但疫情防控下的交通运输保障工作面临着新的挑战,高精准的客流量预测将为交通运输行业管理部门进行综合客运系统监管、疫情精准防控等提供重要依据。

近年来,客流量预测一直都是相关学者的关注热点。在研究对象与预测周期方面,当前的研究成果更多是对铁路或航空等单一出行方式进行的年或月度预测,而对于包含各方式(道路、铁路、水运、航空)在春运等特殊时段期间的预测鲜有涉及。张健等[1]采用时变模型平均法对机场的月客流量进行了预测研究,降低了客流量结构性变化和模型的不确定性预测风险。Milenkovic'等[2]基于SARIMA对铁路月客流量进行了预测,提高了对波动性的刻画精度,结果显示了良好的预测性能。Li等[3]基于IOWHA算子的组合预测精确权重,有效提高了对航空年客流量的预测精度。孙可朝[4]通过对目标函数变化值进行观测,构建了规划求解的组合模型对道路年客流量进行预测。柴乃杰等[5]构建了无偏灰色组合动态模型对铁路年客流量进行预测,有效地提高了预测的准确性。此类成果对于客流集中出行的研判尚显欠缺。在研究方法方面主要包括单一预测模型和组合预测模型[6]。传统的单一客流预测模型对复杂函数的表达能力有限,无法高效利用非线性时间序列中的有效信息。组合预测模型能提高预测精度,但模型复杂程度增加,处理效率降低,若组合不当将导致预测精度下降。孙煦等[7]采用优化后SVM模型对公路客流量进行了预测。吴华稳[8]基于无偏灰色残差理论对铁路客流量进行了预测,预测精度较高。汤银英等[9]构建SARIMA模型对铁路月度客流量进行了预测。钱明军等[10]构建SARIMA-GARCH模型对铁路客流量进行了预测,预测效果优于单一预测模型。Ge等[11]通过ARIMA-FSVR相结合的方法进行预测,降低了客流量长期预测误差。Qin等[12]则采用节性趋势分解程序与回声状态网络相混合的方法对铁路客流量进行了预测。Zhao等[13]基于卷积神经网络与支持向量机组合模型对铁路客流量进行预测并取得了良好的预测效果。在数据基础与影响因素方面,当前的研究多数仅通过历年交通行业统计数据[14]结合天气、经济因素进行预测,而未考虑手机信令、互联网等多源数据融合以吸取不同数据源特点,获取更丰富的信息。Rodriguez等[15]基于GDP和CPI等经济指标因素构建DLMs(动态线性模型)对航空未来5 a客流量进行了预测。Balaka等[16]、Bastola等[17]基于宏观影响因素通过相关回归分析对客流量进行了预测。Aivazidou等[18]基于季度GDP、就业率、失业率等因素对水运客流量进行了预测。

本研究以2016年以来连续7 a的交通运输行业客流量统计数据为基础,结合基于手机信令数据的人口迁徙出行量监测数据,综合考虑节假日、非节假日及疫情常态化防控政策等对客流量预测结果产生影响的相关因素,设计各类因素的标签形成特征矩阵,构建双层平行长短期记忆神经网络模型,提出春运期间客流量的预测研判方法,并以2022年春运期间真实客流量为例对模型精度与有效性进行验证。

1 日客流量特征提取

节假日、非节假日、疫情防控措施等因素会对居民出行产生影响,进而引起不同程度的客运量变化。春节假期、非节假日等典型时段贯穿于整个春运期间,疫情防控措施也成为春运期间客运量预测的显著影响因素。

根据不同时期、不同影响因素对客运量日变化趋势的影响,采用分时段方式对日客运量变化趋势特征进行分析。时段划分包括节假日、非节假日、疫情防控措施等影响因素。其中,节假日期间,居民出行强度大,易形成短暂的出行高峰;非节假日期间,工作日与周末客运量有所差异;疫情防控期间,出行受到一定的约束,不同程度的疫情防控措施将对客运量产生较大的影响。分别分析铁路、道路、水运、航空各运输方式日客运量日分布特征规律。其中,因各运输方式日客运量统计数据为内部数据,故本研究中各运输方式日客运量分析图均为数据处理后的趋势图,而非客运量绝对值。

1.1 非节假日日客运量变化特征规律分析

非节假日期间工作日与周末客运量分布特征存在一定的差异,以周为单位,对相邻各周各运输方式日客运量的变化趋势进行分析。以交通运输行业铁路、道路、水运、航空客运量统计数据为基础,选取2021-01-04至2021-01-31(不含元旦假期)非节假日期间4个周期铁路、道路、水运、航空日客运量监测结果数据,分析每个周期内的客运量变化特征规律,如图 1所示。

图 1 2021年1月非节假日各运输方式日客运量分布特征 Fig. 1 Distribution characteristics of daily passenger volumes of various transport modes on non-holidays in January 2021

图 1中可以看出,铁路日客运量在星期一至星期四总体呈现下降趋势,星期五、星期六逐日回升后,星期日客运量发生回落;道路日客运量在星期一至星期四期间总体呈现下降趋势,星期五回升后客运量趋于平缓;航空日客运量在星期一、星期三、星期五、星期日出现峰值,星期二、星期四、星期六回落;水运日客运量特征较为模糊。

通过以上分析,得到非节假日对各运输方式日客运量的影响具有如下特征:

(1) 各运输方式日客运量在非节假日期间的特征存在显著差异,表明在进行客运量预测时,需要针对不同运输方式客运量日变化特征进行单独预测。

(2) 除水运外,星期对各运输方式的日客运量存在周期性影响,水运客运量虽未呈现典型的周期性规律,但因其在客运总量中的占比小,可在预测时按照其他方式的特征规律进行对比平滑处理。

1.2 节假日日客运量变化特征规律分析

由于临近节假日的日客运量受到节假日出行的影响,选取春节前2 d和春节后1 d的客运量一起进行分析。以交通运输行业公布的统计数据为基础,选取2019年,2020年,2021年这3 a的春节假期及节前2 d和节后1 d的客运量数据,分析节假日的客运量变化规律特征,如图 2所示。

图 2 春节期间客运量变化 Fig. 2 Changes of passenger volume during Spring Festival

图 2可看出, 铁路、道路、水运、航空各方式的日客运量历年变化趋势大体一致。临近春节假期时,日客运量逐渐降低,铁路与道路3 a春节假期期间的日客运量最小值均出现在假期第1天,水运与航空3 a春节假期期间的日客运量最小值出现在假期前1天或假期第1天,随后各运输方式日客运量逐日回升,航空与水运在春节第6天到达峰值,铁路客运量在第7天达到峰值,而道路一直处于上升状态。

通过以上分析,得到节假日对各运输方式日客运量影响具有如下特征:

(1) 各运输方式日客运量在春节期间的日变化特征趋势呈现不同的周期性特征。

(2) 铁路与航空客运量在3 a春节期间的日变化特征趋势相近,且呈现出先降后升随后平缓波动的周期性特征。

(3) 道路客运量在3 a春节期间的日变化特征呈现先降后升的周期性特征。

(4) 水运客运量在3 a春运期间的日变化特征存在一定波动,总体上呈现出先降后升再降的周期性特征。

1.3 受疫情防控措施影响期间日客运量影响因素相关性分析

(1) 确诊人数。由于新冠疫情爆发,确诊人数随之增多,社会传播的可能性增加,出行积极性大幅度降低,各种运输方式的客运量大幅度下滑。以2020年春运为例,确诊人数于2020-02-17达到峰值,客运量处于最小值,随后确诊人数在一段时间内保持低位水平,客运量也在不断恢复过程中。因此选用确诊人数作为疫情影响客运量衡量指标。

(2) 中高风险数量。处于中高风险地区的居民采取“足不出户”的管控措施,居民出行受到一定的限制,而中高风险地区的数量增多,使得出行受限的居民数量随之增加,客运量受到一定波动的影响。

(3) 静默管控、就地过年政策。随着疫情防控政策的不断完善,对中高风险地区实行静默管控方式,居民流动性降低,导致日客运量发生断崖式突变。临近春节期间,外出务工人员担心返乡隔离,返乡热潮衰退。国企事业单位人员响应国家“非必要不外出”、“就地过年”政策措施号召,出行意愿降低,对春运客运存在一定的影响。为了能够度量出“静默管控”、“就地过年”政策对客运量的影响,将以上政策做虚拟变量处理,静默管控期间和就地过年期间标记为1,非静默管控期间和非就地过年期间标记为0。

以2020年、2021年、2022年春运40 d及春运前1个月交通运输行业铁路、道路、水运、航空4种运输方式的客运量统计数据为基础,结合基于手机信令数据计算得到的各运输方式日客运量,鉴于历史序列随时间延长对当前客运量影响程度减弱的特点,选取2021-10至2021-12手机信令数据进行计算,对“确诊人数”、“中高风险地区数量”、“是否就地过年”、“是否静默管控”等因素与各运输方式日客运量之间的相关性进行分析,采用皮尔逊相关系数计算得到春运与各影响因素之间的相关系数与显著性结果,如表 1所示。

表 1 各运输方式日客运量与疫情相关影响因素的相关性 Tab. 1 Correlation between daily passenger volume of each transport mode and epidemic-related influencing factors
铁路 道路 水运 航空
确诊人数 皮尔逊相关性 -0.384** -0.252** -0.227** -0.529**
Sig.(双尾) 0.000 0.000 0.000 0.000
个案数 279 279 279 279
中高风险地区数量 皮尔逊相关性 -0.053 -0.226** -0.031 -0.201**
Sig.(双尾) 0.374 0.000 0.610 0.001
个案数 279 279 279 279
是否就地过年 皮尔逊相关性 0.219 ** -0.236** -0.026 -0.104
Sig.(双尾) 0.000 0.000 0.669 0.084
个案数 279 279 279 279
是否静默管控 皮尔逊相关性 -0.221** -0.174** -0.185** -0.327**
Sig.(双尾) 0.000 0.004 0.002 0.000
个案数 279 279 279 279
注:** 在0.01级别(双尾),相关性显著; * 在0.05级别(双尾),相关性显著。

表 1可以看出,“确诊人数”、“是否静默管控”与各运输方式日客运量的相关性显著,以上2种因素对日客运量影响程度较大。“中高风险地区数量”与道路、航空日客运量的相关性显著,“是否就地过年”与铁路、道路的日客运量的相关性显著,说明“中高风险地区数量”、“是否就地过年”因素仅对部分运输方式的日客运量产生影响。由于返乡途中水运、航空运输方式总量占比少,因此“是否就地过年”与水运、航空的日客运量相关性不显著。

1.4 日客运量特征标签设计

根据非节假日、节假日提取的各运输方式日客流量周期性变化规律及疫情防控措施对日客流量变化特征的影响,分时段的影响难以用线性关系体现出来。因疫情防控措施(静默管控、就地过年)的不确定性,对日客流量的影响很难从历史数据中明确捕捉到相应的特征,因此对各类影响因素进行相应的标签设计。

根据节假日、非节假日日客流量特征规律分析结果,为分别体现春节假期、星期等特征对各运输方式日客流量的周期性影响,对日客流量所对应的春节假期和星期进行标注。

以节假日、非节假日的日客流量特征规律为基础,令各方式中任意第n天的客流量为yn,客流量波动系数βn的计算式为:

(1)

根据上式,可以计算任意1 d对附近客运量的波动系数,并将“前1 d对后1 d的客运量波动”的标签赋值作为客运量波动系数βn

综上所述,在进行春运客运的预测时,将各影响因素标签值标定后作为确定性数据输入到预测模型中。各类标签及其对应的标签值如表 2所示。

表 2 标签名称及代号 Tab. 2 Label names and codes
标签名称 标签代号 对应标签值
非节假日 x1 1,2,3,4,5,6,7
节假日(春节) x2 1,2,3,4,5,6,7
是否静默管控 x3 0,1
是否存在就地过年 x4 0,1
疫情确诊人数 x5 α
客流量波动系数 x6 βn
中高风险地区数量 x7 γ

2 预测模型及方法 2.1 模型适用性及原理

根据对节假日、非节假日及受疫情防控措施影响下日客运量时间维度的分布特征,在节假日与非节假日期间,客运量历史数据具有显著的非线性、非平稳性特征,疫情防控措施的突发性使客运量波动性更加明显。长短期记忆(LSTM) 模型对时间序列平稳性要求低,相比于普通RNN,LSTM依靠对信息的长期过度依赖具备良好的自然处理能力,可更好地处理长序列问题。而模型具备特有的记忆功能,充分挖掘多个输入变量并更准确地捕捉相应的特征,可更好地处理非线性和波动性数据。

作为一种特殊的深度学习网络,基于传统循环神经网络所产生的“梯度消失”和“梯度爆炸”现象,在反向传播参数优化过程中训练效率低等问题。Hochreiter等提出了3种门结构,通过在训练学习过程中有效遗忘一些无效的序列信息,减轻模型训练强度。LSTM的单元结构如图 3所示。

图 3 LSTM隐藏层单元结构 Fig. 3 Unit structure of LSTM hidden layer

图 3中,Ct-1Ct分别为上一时刻和当前时刻记忆细胞;ht-1ht分别为上一时刻和当前时刻隐含层;ftitOt分别为LSTM神经网络中遗忘门、输入门及输出门;σ和tanh为2种激活函数。

ft用来控制上一时刻被舍弃的信息,凭借上一时刻隐藏层的输出ht-1及当前时刻的输入Xt经过激活函数σ变换后将信息传递到Ct,计算过程为:

(2)
(3)

式中,Wf为输入项与遗忘门的权重;bf为输入项与遗忘门的偏执量;Xtt时刻输入;e为自然常数。

it根据当前的输入Xt和上一时刻隐藏层的输出ht-1决定遗忘后有效信息进入当前时刻的状态,如式(4)所示:

(4)

式中, Wi为输入项与输入门的权重; bi为输入项与输入门的偏执量; Xtt时刻输入。

经tanh函数转换得到临时细胞状态Ct,以Ctit乘积与ftCt-1乘积的和,得到当前时刻新的单元状态Ct,计算过程为:

(5)
(6)
(7)

式中, Wc为输入项与临时记忆细胞的权重;bc为输入项与临时记忆细胞的偏执量;tanh为激活函数;e为自然常数;Xtt时刻输入。

为得到当前时刻的隐藏层的输出htCt经过tanh函数转换后与Ot相乘,计算过程为:

(8)
(9)

式中, Wo为输入项与输出门的权重;bo为输入项与输出门的偏执量;Xtt时刻输入。

2.2 客流时间序列预处理

将各运输方式日客流量统计数据和基于手机信令数据计算所得的数据在时间维度上进行拼接融合,采用均值填充方法对缺失数据进行填充,将日客流量特征数据进行融合合并,即特征矩阵At。为了提高预测精度,加快梯度下降的速度,利用StandardScaler模块对日客流量特征各类标签值进行标准化处理后,基于滑动窗口分割方式,将数据Dn={XninYnout}进行重构,对2022年春运客流量进行预测。若双层平行长短期记忆模型输入时间步长为L1, 输出预测步长为L2,则滑动窗口长度为L1+L2。滑动则会产生n-L1-L2+1个长度为L1+L2的矩阵序列。特征矩阵具体表现为, 其中Xtint时刻输入向量矩阵;L1为步长;t∈[1, 2, 3, 4,…]; k为7类特征标签。将处理后的数据D按照8∶2的比例划分为训练集和测试集,其中训练集Dtrain={Xtrain, Ytrain},测试集Dtest={Xtest, Ytest}。

3 算例分析 3.1 预测流程

基于确定各类影响因素(节假日、非节假日、静默管控、确诊人数等)的特征维度,结合春节前返乡、春节后返程等时空分布规律特征,构建双层平行长短期记忆模型进行训练与预测,并对预测结果进行评价。试验过程在Jupyter notebook中采用Python编程语言中的Tensorflow编写训练模型和预测模型,整个试验在Python Keras库中完成。

(1) 数据集划分。以2020年、2021年同期客运量数据作为训练集,2022年春运前15 d的客运数据为测试集, 以2020年、2021年同期客运量数据及2022年春运前15 d的客运量预测结果数据为训练集,2022年春运后25 d的客运数据为测试集。

(2) 参数设置。双层平行长短期记忆模型一次训练样本数为32,迭代次数为100,结合模型中时间步长、隐藏层层数、隐藏单元数、全连接层数等参数,通过遍历循环的方法,利用callbacks回调函数获取模型训练模型的最佳参数组合。各运输方式前15 d、后25 d的预测参数如表 3所示。

表 3 各运输方式前15 d及后25 d预测参数 Tab. 3 Prediction parameters for the first 15 days and the last 25 days of each transport mode
参数 交通方式
铁路 道路 水运 航空

15 d

25 d

15 d

25 d

15 d

25 d

15 d

25 d
时间步长 20 20 20 20 20 20 20 15
隐藏层层数 1 2 1 3 3 3 1 1
隐藏单元数 32 32 32 8 32 32 18 18
全连接层数 3 2 1 3 2 1 1 1

(3) Dropout技术。为了防止过拟合,提高网络的泛化能力,使每层中10%神经元失活,并采用Adam优化器对模型进行优化处理,损失函数为均方误差MSE。对2022年春运前15 d和后25 d的预测结果进行合并,得到2022年春运客运预测值。

(4) 模型评估。模型训练完成后,将测试集Dtest={Xtest, Ytest}中的Xtest输入训练模型中,得到Ytest的对应预测值Ypre。采用均方根误差RMSE和平均绝对百分比误差MAPE作为模型预测效果的评价指标对模型进行评估。其中RMSEMAPE的计算式为:

(11)
(12)

式中,yipre为模型的预测值;yitest为日客运量的真实值;n为日客运量预测数量。

3.2 预测效果

2022年春运期间铁路、道路、水运、航空各方式的日客运量预测结果如图 4所示。

图 4 2022年春运各运输方式日客运量预测 Fig. 4 Prediction of daily passenger volume of each transport mode in 2022 Spring Festival transport

为了检验模型的预测效果,分别从2022年春运期间铁路、道路、水运、航空各方式的客运总量和日客运量进行分析。4种运输方式客运总量和日客运量的RMSEMAPE结果如表 4所示。

表 4 各运输方式客运总量和日客运量误差 Tab. 4 Errors of total and daily passenger volumes of each transport mode
运输方式 MAPE/% RMSE/万人
客运总量 日客运量 客运总量 日客运量
铁路 2.87 10.12 26.54 88.89
道路 6.63 16.8 70.55 344.77
水运 0.49 7.14 2.84 3.82
航空 0.72 9.83 5.34 13.39

综上所述,铁路、民航、水运的预测精度可达90%以上。由于道路数据统计可能因报送口径等因素的影响产生误差,道路的日客运量预测值与真实值之间拟合效果相对较低,但精度仍然在80%以上。由此可见,双层平行长短期记忆神经网络模型对疫情影响下的春运期间客运量预测具有较好的支撑作用。

3.3 模型对比分析

为了进一步验证预测的效果和精度,将原始数据采用既有客运量预测方法进行预测,既有客运量预测方法包括:岭回归(RR)模型[6]、支持向量机(SVM)模型[10]及门循环单元(GRU)模型[14]。将既有的客运量预测方法与双层平行长短期记忆模型进行对比,如图 5所示。

图 5 各方式不同预测方法下春运客运量预测效果对比 Fig. 5 Comparison of predictioning effects of passenger volume of Spring Festival transport obtained by different predictioning methods

图 5可以看出,双层平行长短期记忆模型对春运客运量的预测拟合效果相对于其他3种模型预测结果精度更好。不同预测方法得到的春运客运预测结果的MAPE值与RMSE值分别见表 5表 6

表 5 不同预测方法下的春运客运量预测的MAPE值对比 Tab. 5 Comparison of MAPE values of passenger volume of Spring Festival transport obtained by different prediction methods
运输方式 MAPE/%
LSTM SVM RR GRU
铁路 10.12 42.19 40.78 41.68
道路 16.8 18.56 183 25.22
水运 7.14 18.2 24.43 20.6
航空 9.83 23.1 65.9 37.19

表 6 不同预测方法下的春运客运量预测的RMSE值对比 Tab. 6 Comparison of RMSE values of passenger volume of Spring Festival transport obtained by different prediction methods
运输方式 RMSE/万人
LSTM SVM RR GRU
铁路 88.89 224.92 218.49 222.7
道路 344.77 355.93 1 055.52 443.3
水运 3.82 8.53 9.5 11.22
航空 13.39 25.51 41.61 32.33

表 5表 6中可以看出,双层平行长短期记忆模型的预测方法的MAPE值和RMSE值误差最小,更适于疫情防控措施影响下的客运量预测。

4 结论

(1) 本研究分析了节假日与非节假日期间铁路、道路、水运、航空等各运输方式日客运量变化的特征规律,挖掘了典型时段期间各运输方式日客运量潜在的周期性规律。

(2) 对疫情防控措施下影响各运输方式日客运量变化的特征因素进行了相关性分析,得到“确诊人数”、“静默管控”等因素对各运输方式日客运量均影响显著;“中高风险地区数量”对道路、航空的日客运量影响显著;“是否就地过年”对铁路、道路影响显著。

(3) 采用双层平行长短期记忆模型对疫情常态化影响下的2022年春运客运进行了预测,平均预测精度达89%,其中铁路、水运及航空的预测精度可达90%以上,道路的预测精度可达80%以上,说明本研究提出的预测方法能为交通运输行业管理部门进行重点时段的综合客运系统监管和疫情常态化防控期间的客运预测提供有效的数据与技术支撑。

参考文献
[1]
张健, 孙玉莹, 张新雨. 基于时变模型平均方法的我国航空客流量预测[J]. 系统工程理论与实践, 2020, 40(6): 1509-1519.
ZHANG Jian, SUN Yu-ying, ZHANG Xin-yu. Time-varying Forecast Averaging for Air Passengers in China[J]. Systems Engineering — Theory & Practice, 2020, 40(6): 1509-1519.
[2]
MILENKOVIĆ M, ŠVADLENKA L, MELICHAR V, et al. SARIMA Modelling Approach for Railway Passenger Flow Forecasting[J]. Transport, 2018, 33(5): 1113-1120.
[3]
LI C. Combined Forecasting of Civil Aviation Passenger Volume Based on ARIMA-regression[J]. International Journal of System Assurance Engineering and Management, 2019, 10: 945-952.
[4]
孙可朝. 基于规划求解的组合预测模型在道路客运量预测中的应用[J]. 公路交通科技, 2017, 34(12): 103-107, 114.
SUN Ke-chao. Application of Combination Forecasting Model Based on Planning Solving in Road Passenger Transport Volume[J]. Journal of Highway and Transportation Research and Development, 2017, 34(12): 103-107, 114. DOI:10.3969/j.issn.1002-0268.2017.12.015
[5]
柴乃杰, 周文梁. 基于无偏灰色组合动态模型的铁路客运量预测研究[J]. 铁道标准设计, 2023, 67(2): 10-15.
CHAI Nai-Jie, ZHOU Wen-liang. Research on Forecasting Railway Passenger Flow Based on Unbiased-gray Combined and Dynamic Model[J]. Railway Standard Design, 2023, 67(2): 10-15. DOI:10.13238/j.issn.1004-2954.202203020001
[6]
周展, 王文强. 我国铁路客运量短期预测模型修正及比较[J]. 统计与决策, 2019, 35(21): 66-71.
ZHOU Zhan, WANG Wen-qiang. Modification and Comparison of Short-term Forecasting Models for Railway Passenger Volume in China[J]. Statistics & Decision, 2019, 35(21): 66-71. DOI:10.13546/j.cnki.tjyjc.2019.21.015
[7]
孙煦, 陆化普, 吴娟. 基于蚁群优化支持向量机模型的公路客运量预测[J]. 合肥工业大学学报(自然科学版), 2012, 35(1): 124-129.
SUN Xu, LU Hua-pu, WU Juan. Passenger Traffic Volume Forecasting Based on Support Vector Machine Model Optimized by Ant Colony Algorithm[J]. Journal of Hefei University of Technology, 2012, 35(1): 124-129. DOI:10.3969/j.issn.1003-5060.2012.01.031
[8]
吴华稳. 基于无偏灰色残差理论的铁路客运量预测研究[J]. 铁道运输与经济, 2019, 41(5): 121-126.
WU Hua-wen. A Research on Railway Transportation Prediction Based on Unbiased Grey Residual Theory[J]. Railway Transport and Economy, 2019, 41(5): 121-126. DOI:10.16668/j.cnki.issn.1003-1421.2019.05.23
[9]
汤银英, 朱星龙, 李龙. 基于SARIMA模型的铁路月度客运量预测[J]. 交通运输工程与信息学报, 2019, 17(1): 25-32.
TANG Yin-ying, ZHU Xing-long, LI Long. Monthly Railway Passenger Traffic Volume Forecasting Based on SARIMA Model[J]. Journal of Transportation Engineering and Information, 2019, 17(1): 25-32. DOI:10.3969/j.issn.1672-4747.2019.01.005
[10]
钱名军, 李引珍, 阿茹娜. 基于季节分解和SARIMA-GARCH模型的铁路月度客运量预测方法[J]. 铁道学报, 2020, 42(6): 25-34.
QIAN Ming-jun, LI Yin-zhen, A Ru-na. Method on Monthly Railway Passenger Traffic Forecast Based on Seasonal Decomposition and SARIMA-GARCH Model[J]. Journal of the China Railway Society, 2020, 42(6): 25-34. DOI:10.3969/j.issn.1001-8360.2020.06.004
[11]
MENG G, ZHANG J, WU J, et al. ARIMA-FSVR Hybrid Method for High-speed Railway Passenger Traffic Forecasting[J]. Mathematical Problems in Engineering: Theory, Methods and Applications 2021, 2021, 1-5. DOI:10.1155/2021/9961324
[12]
QIN L, LI W, LI S. Effective Passenger Flow Forecasting Using STL and ESN Based on Two Improvement Strategies[J]. Neurocomputing, 2019, 356: 244-256.
[13]
ZHAO S, MI X. A Novel Hybrid Model for Short-term High-speed Railway Passenger Demand Forecasting[J]. IEEE Access, 2019, 7: 175681-175692.
[14]
LIU L, CHEN R C, ZHU S. Impacts of Weather on Short-term Metro Passenger Flow Forecasting Using a Deep LSTM Neural Network[J]. Applied Sciences, 2020, 10(8): 10082962.
[15]
RODRIGUEZ Y, PINEDA W, OLARIAGA O D. Air Traffic Forecast in Post-liberalization Context: A Dynamic Linear Models Approach[J]. Aviation, 2020, 24(1): 10-19.
[16]
[17]
BASTOLA D P. Air Passenger Demand Model (APDM): Econometric Model for Forecasting Demand in Passenger Air Transports in Nepal[J]. International Journal of Advanced Research and Publications, 2017, 1(4): 238-242.
[18]
AIVAZIDOU E, POLITIS I. Transfer Function Models for Forecasting Maritime Passenger Traffic in Greece under an Economic Crisis Environment[J]. Transportation Letters, 2021, 13(8): 591-607.