扩展功能
文章信息
- 高爱云, 张兴源, 刘少华, 孟宇飞.
- GAO Aiyun, ZHANG Xingyuan, LIU Shaohua, MENG Yufei
- 洛阳市客车行驶工况构建
- Bus driving cycle construction in Luoyang City
- 公路交通科技, 2025, 42(4): 171-178
- Journal of Highway and Transportation Research and Denelopment, 2025, 42(4): 171-178
- 10.3969/j.issn.1002-0268.2025.04.020
-
文章历史
- 收稿日期: 2023-12-07
汽车的行驶工况是汽车产品研发、匹配、评价的基础,也是汽车节能和排放测试评价的重要依据,对车辆在实际道路环境条件下的燃油经济性、舒适性、可靠性和排放性具有决定性影响[1]。近年来,洛阳市机动车保有量大幅增长,其中客车也越来越多,根据国外和国内其他城市所构建的行驶工况难以反映洛阳市客车的交通情况,因此需要构建符合洛阳市客车运行情况的行驶工况。
国内外学者对汽车行驶工况构建的研究多是基于K-means算法。马来西亚丁加奴大学的Anida[2]基于K-means算法构建了丁加奴市公交车的行驶工况,并利用开发的工况分析公交车的燃油经济性和排放性。伊朗科技大学的Mafi[3]基于K-means算法构建了德黑兰市汽车行驶工况。刘子谭[4]基于K-means算法构建了广州市汽车行驶工况。李洪雪[5]基于K-means算法构建了宁波市重型危险品半挂列车的行驶工况。Zhao[6]基于K-means和SVM混合聚类算法构建了西安市城市电动汽车的行驶工况。传统K-means算法初始质心的选取是完全随机的,并且当初始质心数(K值)较少时包含数据点少的类获取到质心的几率低,因此K-means算法的聚类结果容易陷入局部最优。
本研究以洛阳市客车的实际运行状况为研究对象,提出了一种基于改进K-means算法的工况构建方法,基于洛阳市客车的实车数据构建出了其行驶工况,最终与基于传统K-means算法所构建的行驶工况、原始数据和国内外典型行驶工况进行对比,验证本研究所构建工况的准确性和构建符合洛阳市客车实际行驶状况的必要性。
1 数据采集和预处理本研究构建洛阳市客车行驶工况所采用的技术路线如图 1所示。
|
| 图 1 行驶工况开发技术路线 Fig. 1 Technical route of driving cycle development |
| |
为了保证所构建工况具有代表性,同时减少工作量,筛选出75路、50路、16路3条公交线路,每条线路选取3辆客车进行实车数据采集。所选线路涵盖了小区、商场、车站等拥堵道路和快速干道、郊区道路等通畅道路,具有一定代表性[7]。
数据采集时间为6:00—20:00,数据采集试验为期1周,涵盖了高峰期和平峰期、工作日和周末。试验数据由GPS设备以1 Hz频率采集,通过4G天线传输到云端监控和储存平台。所获数据包含的信息有:时间、车速、加速度、道路坡度、经纬度、里程等。由于外界环境和数据采集设备本身的影响,原始数据中可能存在无效数据和异常数据,如车速长时间为0 km·h―1, 加/减速度大于该型号汽车所能达到的极限等。无效数据和异常数据会影响所构建工况的准确性,因此需要对原始数据进行数据预处理[8-9]。由于道路坡度、经纬度等对构建工况的准确度影响不大,所以可忽略不计。图 2为数据预处理后所获得的部分原始数据。
|
| 图 2 部分原始数据 Fig. 2 Partial raw data |
| |
将经过数据预处理后的原始数据进行运动学片段划分。运动学片段是指车辆从一个怠速段开始到下一个运行段结束之间的运动过程[10],如图 3所示,最终得到2 846个具有不同特征的运动学片段。
|
| 图 3 运动学片段示意图 Fig. 3 Schematic diagram of kinematics segment |
| |
2 数据特征参数降维和聚类分析 2.1 特征参数提取
全面且合理的特征参数是构建高精度汽车行驶工况的前提,是后续主成分分析特征降维与聚类分析的基础[11]。为全面描述每个运动学片段的驾驶信息,综合反映车辆行驶特征,本研究定义了15个特征参数,如表 1所示。
| 特征参数 | 定义 |
| V | 平均速度 |
| Vmax | 最大速度 |
| amax | 最大加速度 |
| aap | 加速段平均加速度 |
| amin | 最大减速度 |
| adp | 减速段平均减速度 |
| Pa | 加速时间比 |
| Pd | 减速时间比 |
| Pi | 怠速时间比 |
| Pm | 匀速时间比 |
| s | 运行距离 |
| t | 运行时间 |
| Vp | 平均运行速度 |
| Vb | 速度标准差 |
| ab | 加速度标准差 |
2.2 基于主成分分析法的数据降维
在处理多变量大数据集时,数据集的各特征参数之间必然存在信息重叠,如平均车速、运行时间和怠速时间直接影响了运行距离,通过数据降维可以去除冗余,且降维处理后的结果依然能反映原多变量大数据集的大部分信息。主成分分析法是一种使用最为广泛的特征降维方法,首先通过计算数据构成矩阵的协方差矩阵,其次计算得到协方差矩阵的特征向量,最后选择满足工程要求的一定数量的主成分组成矩阵,从而将数据特征降维[12-13]。具体步骤如下:
(1) 初始数据的标准化
每一个运动学片段均由15个特征参数描述,为消除特征参数之间不同量纲的影响,需要对特征参数矩阵进行标准化处理。
|
(1) |
式中,Am×n为m个运动学片段及其n个运动学特征参数所构成的特征参数矩阵,本研究运动学片段数量为2 846,则m为2 846,特征参数选取了15种,则n为15。
对Am×n中的元素进行如下标准化处理:
|
(2) |
式中,
(2) 计算协方差矩阵和相关系数矩阵
由标准化后的矩阵计Bm×n算得到协方差矩阵C,为:
|
(3) |
其中:
|
(4) |
式中,cov (x, y)为矩阵Bm×n的x列与y列之间的协方差,x, y分别为x列, y列的平均值,x,y=1, 2, …, n。
进一步计算出相关系数矩阵:
|
(5) |
式中dij为第i列与第j列的相关系数:
|
(6) |
(3) 计算主成分贡献率和累计贡献率
根据行列式|λ-D|=0求出矩阵D的n个特征值,并按从大到小顺序排列:
|
(7) |
|
(8) |
式中,p为第j个主成分的贡献率,用来反映该主成分所表达信息的全面程度,主成分的贡献率越大则其表达的信息越全面;P为前e个主成分的累计贡献率,累计贡献率不低于80%可认为满足工程需要[14]。
通过Matlab编程对提取的运动学片段的特征参数进行分析处理,得到各主成分贡献率及累加贡献率如表 2所示。
| 主成分/M | 特征值 | 贡献率/% | 累计贡献率/% |
| 1 | 5.289 2 | 35.26 | 35.26 |
| 2 | 2.696 6 | 17.98 | 53.24 |
| 3 | 2.309 6 | 15.40 | 68.64 |
| 4 | 1.795 1 | 11.97 | 80.61 |
| 5 | 0.992 4 | 6.62 | 87.23 |
| 6 | 0.645 1 | 4.30 | 91.53 |
| 7 | 0.462 9 | 3.09 | 94.62 |
| 8 | 0.328 8 | 2.19 | 96.81 |
| 9 | 0.171 4 | 1.14 | 97.95 |
| 10 | 0.138 8 | 0.93 | 98.88 |
| 11 | 0.073 2 | 0.49 | 99.37 |
| 12 | 0.049 2 | 0.33 | 99.70 |
| 13 | 0.023 5 | 0.16 | 99.86 |
| 14 | 0.015 8 | 0.11 | 99.97 |
| 15 | 0.008 5 | 0.03 | 100.00 |
由表 2可知,前4个主成分的累计贡献率为80.61%,且特征值均大于1,因此,本研究选取第1主成分M1、第2主成分M2、第3主成分M3和第4主成分M4共4个主成分来反映原始数据的整体特征,将特征参数从15维降到4维,降维后的原始数据特征参数矩阵如表 3所示。
| 运动学片段序号 | M | |||
| 1 | 2 | 3 | 4 | |
| 1 | 2.711 | ―3.491 | ―0.130 | ―0.569 |
| 2 | 1.224 | ―0.612 | ―0.491 | 0.408 |
| 3 | 1.266 | ―2.323 | 0.408 | ―0.931 |
| 4 | ―3.635 | 2.325 | 2.552 | 0.866 |
| … | … | … | … | … |
| 2 846 | ―3.590 | 0.382 | 0.527 | 0.496 |
2.3 K*-means算法的数据聚类
K-means聚类算法作为无监督学习算法中最为经典的聚类算法之一,长久以来因其简便高效的优点得到广泛应用,但K-means算法初始质心的选择是完全随机的,其聚类结果的优劣度与初始质心的选择有极大关联[15]。为了减少初始质心随机选取的影响,本研究提出了基于K*-means算法的汽车行驶工况构建方法。K*-means算法是在K-means算法的基础上改进而来的,两者之间的区别是,K*(K*-means算法初始质心数)>K。由于K*>K,包含数据点数少的类获得质心的概率得到了提高,然后合并质心最接近的两个类,直到类的总数达到K。K*-means算法的具体步骤如下:
(1) 确定K*的值。为了兼顾计算结果的可靠性和计算速度,K*应不小于2K[16],经过后续试验验证K*=2K所构建的工况精度更高,因此本研究取K*=2K。
(2) 初始化。使用K-means聚类算法随机选择K*个质心,将数据所有的点分配到K*个类中,更新质心直到误差平方和局部最小。误差平方和的计算公式为:
|
(9) |
式中,pi为任意一点;mj为第j个类的中心点;pi属于第j个类时δij=1,否则δij=0。
(3) 合并中心点相距最近的两个类。计算所有类质心之间的距离,选择相距最近的两个类进行合并,计算并记录合并后的最小误差平方和SSE(n)和当前的聚类结果。
(4) 重复h次步骤(2)~ (3),使得(K*-h)=K。(其中,每循环执行步骤(2)一次,K*减去1)
基于上述流程在Matlab中编写程序,同时也编写出K-means算法程序,其中经过K*-means算法聚类后2 846个运动学片段的误差平方以及所属类别如表 4所示。
| 运动学片段序号 | 误差平方 | 所属类别 |
| 1 | 6.51 | 1 |
| 2 | 10.97 | 1 |
| 3 | 4.98 | 3 |
| 4 | 1.37 | 1 |
| 5 | 1.08 | 3 |
| 6 | 1.84 | 4 |
| 7 | 3.22 | 1 |
| 8 | 7.45 | 2 |
| … | … | … |
| 2 846 | 22.98 | 2 |
本研究通过比较两种算法聚类后的误差平方和大小来对比两种算法的优劣[17]。使用K-means算法分别在K=2,3,…,8的情况下进行试验,考虑到K-means算法初始质心的选取具有随机性,将上述9个试验均重复10次,选取每个试验中最小的误差平方SSEK(K)和与K*-means算法处理的结果SSEK* (K)进行对比。由试验结果得知,基于K-means算法的误差平方和的“拐点”在K=4时出现,预测基于K*-means算法的“拐点”也出现在K=4,因此K*取值为8,逐步合并直到剩余2个质心,记录每一次合并后的误差平方和。两种算法的最终结果如图 4所示。
|
| 图 4 误差平方和对比 Fig. 4 Comparison of sum of square error |
| |
由图 4可知,当K=8时,K*-means算法的质心完全随机选取,而K-means算法的SSEK(8)取10次结果中的最小值,因此SSEK* (8)> SSEK(8);当K=7时,K*-means算法合并相距最近的两个类,降低了质心随机选取造成的影响,SSEK*开始降低。整体来看,SSEK* < SSEK,说明K*-means算法聚类效果更好。两种算法的“拐点”都出现在K=4,因此取两种算法K=4时的聚类结果分别构建行驶工况。
3 工况合成及验证参考国内外工况构建经验,所构建的工况行驶时间长度一般为1 500 s左右。将聚类结果中每个类的运动学片段按类中心距离进行排序,按各类所包含样本占样本总量的时间比例选择相应数量的运动学片段,时间占比计算公式为:
|
(10) |
式中,δi为时间占比;Ti为第i类工况所有运动学片段的总时间;K=1, 2, 3, 4。
运动学片段的选取满足以下条件:
|
(11) |
式中,mi为第i类工况中的片段总数;Ti, c为第i类工况中排序为c的片段时间。
通过上述方法计算后,最终构建出洛阳市客车行驶工况(Driving Cycle of Bus in Luoyang, LY_ BDC),工况包含12条典型运动学片段,总时长为1 587 s,如图 5所示。
|
| 图 5 洛阳市客车行驶工况(LY_ BDC) Fig. 5 Driving cycle of buses in Luoyang City(LY_ BDC) |
| |
为验证基于K*-means算法构建工况的准确性,选取经过数据预处理的原始数据的平均速度V、加速段平均加速度aap、减速段平均减速度adp、加速时间比Pa、减速时间比Pd、怠速时间比Pi和匀速时间比Pm作为特征参数,将LY_ BDC工况、基于传统K-means算法构建的行驶工况(Driving cycle based on traditional K-means, TKDC)与原始数据进行特征参数对比,结果如表 5所示。
| 参数名称 | 原始数据 | LY_BDC | TKDC |
| V | 19.30 | 19.44 | 16.81 |
| aap | 0.462 | 0.474 | 0.486 |
| adp | 0.475 | 0.467 | 0.462 |
| Pa | 25.3 | 25.1 | 26.3 |
| Pd | 23.9 | 24.1 | 24.3 |
| Pi | 22.8 | 23.7 | 21.8 |
| Pm | 28.0 | 27.1 | 27.6 |
由表 5可知,LY_ BDC工况与原始数据的特征参数值最为接近,各特征参数值的平均相对误差为1.97%,其中怠速时间比的相对误差最大,仅有3.9%;TKDC工况与原始数据的特征参数值平均相对误差为4.6%,其中平均速度的相对误差最大,达到了12.9%。因此,基于K*-means算法所构建的工况精度更高。
将所构建的LY_ BDC工况与原始数据、新欧洲测试循环(New European Driving Cycle, NEDC)[18]和中国典型城市公交循环(China City Bus Cycle, CCBC)[19]的主要特征参数进行对比,所选择的参数有:怠速时间比Pi、加速时间比Pa、匀速时间比Pm、减速时间比Pd和平均速度V,如图 6所示。
|
| 图 6 LY_BDC工况与国内外其他工况特征参数对比 Fig. 6 Comparison of feature parameters between LY_ BDC driving cycle and other driving cycles at home and abroad |
| |
通过对比可知,国内外其他工况均无法准确地反映洛阳市客车的实际运行状况,CCBC与原始数据的Pa,Pi和V差异较大;NEDC与原始数据的Pd,Pm差异也很明显。LY_ BDC工况对原始数据最具代表性,说明LY_ BDC工况能够有效的反映本市当前的客车实际行驶情况。
4 结论本研究以洛阳市3条典型线路上的9辆客车的实车数据为基础,提出了K*-means算法的行驶工况构建方法。
(1) 通过数据预处理和运动学片段划分,得到2 846个运动学片段,采用传统K-means算法分别基于2,3,…,8个初始质心对运动学片段进行聚类处理,通过“拐点”位置确定K=4,则K*=8,采用K*-means算法对运动学片段进行聚类处理,通过对比二者误差平方和可知,K*-means算法聚类效果更理想。
(2) 取K*-means算法、K-means算法质心为4时的聚类结果分别构建了LY_ BDC工况和TKDC工况,对比二者与原始数据的特征参数可知,LY_BDC工况更加准确。
(3) 对比LY_ HBDC工况与国内外其他工况的主要特征参数,结果表明国内外其他工况与原始数据差异较大,证明了构建洛阳市客车行驶工况的必要性。
(4) 通过K*-means算法,提高了数据点数少的类获得质心的概率,并降低质心随机选取造成的影响,避免了孤立点的问题。
| [1] |
DHITAL N B, WANG S X, LEE C H, et al. Effects of driving behavior on real-world emissions of particulate matter, gaseous pollutants and particle-bound PAHs for diesel trucks[J].
Environmental Pollution, 2021, 286: 117292.
DOI:10.1016/j.envpol.2021.117292 |
| [2] |
ANIDA I N, NORBAKYAH J S, YUSSOF W N J H W, et al. Driving data analysis for the development of Kuala Terengganu driving cycle[C]//International Conference on Mechanical Engineering Research. Berlin: Springer, 2023: 3-14.
|
| [3] |
MAFI S, KAKAEE A, MASHADI B, et al. Developing local driving cycle for accurate vehicular CO2 monitoring: A case study of tehran[J].
Journal of Cleaner Production, 2022, 336: 130176.
DOI:10.1016/j.jclepro.2021.130176 |
| [4] |
刘子谭, 朱平, 刘旭鹏, 等. K均值聚类改进与行驶工况构建研究[J]. 汽车技术, 2019(11): 57-62. LIU Zitan, ZHU Ping, LIU Xupeng, et al. Research on improved K-means and driving cycle construction[J]. Automobile Technology, 2019(11): 57-62. |
| [5] |
李洪雪, 李世武, 孙文财, 等. 重型危险品半挂列车行驶工况的构建[J]. 吉林大学学报(工学版), 2021, 51(5): 1700-1707. LI Hongxue, LI Shiwu, SUN Wencai, et al. Driving cycle construction of heavy semi-trailers carrying hazardous cargos[J]. Journal of Jilin University(Engineering and Technology), 2021, 51(5): 1700-1707. |
| [6] |
ZHAO X, YU Q, MA J, et al. Development of a representative EV urban driving cycle based on a K-means and SVM hybrid clustering algorithm[J].
Journal of Advanced Transportation, 2018, 2018(1): 1-18.
|
| [7] |
尤国贵, 卢剑伟, 苏俊收, 等. 重型半挂牵引车行驶工况研究及其动力传动系统优化[J]. 汽车工程, 2022, 44(11): 1735-1745. YOU Guogui, LU Jianwei, SU Junshou, et al. Research on driving cycles of heavy semi-trailer tractor and optimization of its powertrain system[J]. Automotive Engineering, 2022, 44(11): 1735-1745. |
| [8] |
郭家琛, 姜衡, 雷世英, 等. 城市道路汽车行驶工况构建方法[J]. 交通运输工程学报, 2020, 20(6): 197-209. GUO Jiachen, JIANG Heng, LEI Shiying, et al. Vehicle driving cycle construction method of urban roads[J]. Journal of Traffic and Transportation Engineering, 2020, 20(6): 197-209. |
| [9] |
徐婷婷, 龙方家, 胡晓锐, 等. 基于大数据驱动的山地环境纯电动汽车运行工况[J]. 公路交通科技, 2024, 41(1): 177-185. XU Tingting, LONG Fangjia, HU Xiaorui, et al. Battery electric vehicle's driving cycle in mountain environment based on big data[J]. Journal of Highway and Transportation Research and Development, 2024, 41(1): 177-185. DOI:10.3969/j.issn.1002-0268.2024.01.020 |
| [10] |
孙文, 荣浚材, 王军年, 等. 带弯道信息的城市复合行驶工况构建方法研究[J]. 汽车工程, 2021, 43(10): 1519-1527. SUN Wen, RONG Juncai, WANG Junnian, et al. Research on the construction method of urban compound driving conditions with curve information[J]. Automotive Engineering, 2021, 43(10): 1519-1527. |
| [11] |
李兵兵, 康宇, 曹洋, 等. 基于短行程特征聚类的移动源排放清单构建方法[J]. 合肥工业大学学报(自然科学版), 2023, 46(12): 1585-1594. LI Bingbing, KANG Yu, CAO Yang, et al. Mobile source emission inventory construction based on short-stroke feature clustering[J]. Journal of Hefei University of Technology(Natural Science), 2023, 46(12): 1585-1594. DOI:10.3969/j.issn.1003-5060.2023.12.001 |
| [12] |
范童谣. 基于数据驱动的商用物流车行驶工况构建与能效特征研究[D]. 重庆: 重庆理工大学, 2024. FAN Tongyao. Construction of driving conditions and energy efficiency characteristics of commercial logistics vehicles based on data drive[D]. Chongqing: Chongqing University of Technology, 2024. |
| [13] |
陈维荣, 刘禺贝, 戴朝华, 等. 有轨电车典型行驶工况的构建[J]. 西南交通大学学报, 2020, 55(6): 1141-1146, 1190. CHEN Weirong, LIU Yubei, DAI Chaohua, et al. Construction of typical driving conditions of trams[J]. Journal of Southwest Jiaotong University, 2020, 55(6): 1141-1146, 1190. |
| [14] |
薛玉强, 蒋荣超, 郑旭光. 基于车联网数据的商用车行驶工况构建方法[J]. 公路交通科技, 2023, 40(8): 192-198. XUE Yuqiang, JIANG Rongchao, ZHENG Xuguang. A method for constructing commercial vehicle driving cycle based on IOV data[J]. Journal of Highway and Transportation Research and Development, 2023, 40(8): 192-198. |
| [15] |
金思含, 彭忆强, 武小花, 等. 成都市燃料电池公交车示范运行行驶工况的构建[J]. 汽车安全与节能学报, 2022, 13(1): 202-208. JIN Sihan, PENG Yiqiang, WU Xiaohua, et al. Construction of the driving cycle for fuel cell bus running in Chengdu demonstration area[J]. Journal of Automotive Safety and Energy Efficiency, 2022, 13(1): 202-208. |
| [16] |
NIE F P, LI Z H, WANG R, et al. An effective and efficient algorithm for K-means clustering with new formulation[J].
IEEE Transactions on Knowledge and Data Engineering, 2023, 35(4): 3433-3443.
DOI:10.1109/TKDE.2022.3155450 |
| [17] |
孙骏, 方涛, 张炳力, 等. 基于改进K-均值聚类算法的合肥市电动客车行驶工况构建[J]. 汽车技术, 2020(8): 56-62. SUN Jun, FANG Tao, ZHANG Bingli, et al. Construction of Hefei electric buses driving cycle based on improved K-means clustering[J]. Automobile Technology, 2020(8): 56-62. |
| [18] |
郑宜嘉, 孙健, 年光跃. 基于实际运行工况的电动商用车能耗仿真与参数优化[J]. 中国公路学报, 2022, 35(5): 243-253. ZHENG Yijia, SUN Jian, NIAN Guangyue. Energy consumption simulation and parameter optimization of electric commercial vehicles based on real-world driving cycle[J]. China Journal of Highway and Transport, 2022, 35(5): 243-253. |
| [19] |
赵天宇, 陈东, 霍为炜, 等. 氢燃料电池汽车能量管理系统模糊控制仿真研究[J]. 重庆理工大学学报(自然科学版), 2022, 36(3): 36-40. ZHAO Tianyu, CHEN Dong, HUO Weiwei, et al. Simulation of energy management system of hydrogen fuel cell vehicle based on fuzzy control[J]. Journal of Chongqing University of Technology(Natural Science), 2022, 36(3): 36-40. |
2025, Vol. 42


,