智能交通
张添翼, 杨涵, 田俊山, 王歆远
为了更高效地利用高速公路ETC数据集并提升数据处理速度,深入分析ETC用户的主要特征和高速公路存在的潜在问题。以我国某省份某高速公路出入口2023年6月的ETC通行数据为例,通过Python编程语言对数据进行清洗,采用环形特征编码处理时间数据,并运用K-means聚类算法对数据进行处理。重点关注入口时间、出口时间、本省通行里程等指标,对用户的收费里程、速度以及行驶时间3个核心特征进行分析,借助聚类中心点和雷达图进行可视化展示。分析结果显示,傍晚时段的通行效率较低,晚间疲劳驾驶和午夜超速问题较为突出。根据通行里程分析,白天主要以短程和中程用户为主,长程用户倾向于在上午进入高速公路,同时,该高速公路存在大量的通勤车辆。在速度分析方面,低速组多为短途车辆。K-means聚类算法的应用使得数据处理过程快速且可靠,结合更多的ETC数据,可以进一步深入了解高速公路通行的主要群体和状况。研究成果可为制定差异化收费政策提供有力依据。例如,通过聚类分析进入高速公路的时间,确定高峰时段和低谷时段,适时提高高峰时段的费用,降低低谷时段的费用,从而提高通行效率、平衡路网流量。这具有重要的现实意义。