基于智能手机的城市道路车辆即时识别

扩展功能

加入引用管理器

Email Alert

文章信息

胡剑琇, 朱前坤, 张琼, 杜永峰

HU Jian-xiu, ZHU Qian-kun, ZHANG Qiong, DU Yong-feng

基于智能手机的城市道路车辆即时识别

Real-time Recognition of Vehicle on Urban Road Based on Smart Phone

公路交通科技, 2023, 40(1): 208-217

Journal of Highway and Transportation Research and Denelopment, 2023, 40(1): 208-217

10.3969/j.issn.1002-0268.2023.01.024

文章历史

收稿日期: 2020-11-26

Abstract

PDF

Figures

Tables

引用本文

胡剑琇, 朱前坤, 张琼, 杜永峰. 基于智能手机的城市道路车辆即时识别[J]. 公路交通科技, 2023, 40(1): 208-217.

HU Jian-xiu, ZHU Qian-kun, ZHANG Qiong, DU Yong-feng. Real-time Recognition of Vehicle on Urban Road Based on Smart Phone[J]. Journal of Highway and Transportation Research and Denelopment, 2023, 40(1): 208-217.

基于智能手机的城市道路车辆即时识别

胡剑琇¹ , 朱前坤^1,2 , 张琼¹ , 杜永峰^1,2

1. 兰州理工大学防震减灾研究所，甘肃兰州 730050;
2. 兰州理工大学甘肃省减震隔震国际合作研究基地，甘肃兰州 730050

收稿日期: 2020-11-26

基金项目: 国家自然科学基金项目(51868046, 51668042);甘肃省高等学校产业支撑计划项目(2020C-40)

作者简介: 胡剑琇(1997-)，女，山西汾阳人，硕士

摘要: 为及时了解路段交通状况，使用计算机视觉方法对城市道路上行驶中的车辆进行即时检测并分类计数，以便更便捷地对某路段交通状况进行定性定量的评估。使用普通的智能手机对城市道路拍摄视频，采用一种以YOLOv3为基础的目标检测和跟踪方法，实现了对车辆的分类识别、跟踪与计数。在配置好的Python环境下，YOLOv3算法可以快速准确地进行车辆分类检测，随后利用Deep Sort跟踪算法对各类车辆进行分类计数，得到了每帧画面中的各类车辆的数量。统计通过该路段的1 000多辆车的型号，结合已有的汽车质量数据，对不同种类汽车重量的统计结果分别进行分布拟合，得到了每种车辆的车身质量的代表值。将质量代表值代入到识别出的计数结果中，对这一交通要道任一时段的汽车荷载进行了分析。结果表明：得出的汽车质量代表值和汽车数量分布，可以估算出每帧路面的车辆均布荷载，得到各个高峰期车辆均布荷载的分布区间；将其与规范规定的均布荷载标准值进行对比, 发现至少在95%的情况下车辆均布荷载不会超过规定的均布荷载标准值，大部分时间符合规范要求；但在交通拥堵的情况下，车辆均布荷载也会超过规定的均布荷载标准值。因此，使用智能手机随时随地采集视频可快速准确地对车辆进行分类识别，并统计该路段的负载情况，对交通流量限制措施具有指导作用。

关键词: 城市交通分类识别 YOLOv3 车辆荷载智能手机跟踪计数

Real-time Recognition of Vehicle on Urban Road Based on Smart Phone

HU Jian-xiu¹, ZHU Qian-kun^1,2, ZHANG Qiong¹, DU Yong-feng^1,2

1. Institute of Earthquake Protection and Disaster Mitigation, Lanzhou University of Technology, Lanzhou Gansu 730050, China;
2. International Research Base of Seismic Mitigation and Isolation of Gansu Province, Lanzhou University of Technology, Lanzhou Gansu 730050, China

Abstract: In order to understand the traffic situation of road section in time, the vehicles moving on the urban road are instantly detected, classified and counted by using the computer vision method, so that the traffic situation of a road section can be assessed qualitatively and quantitatively more conveniently. The videos on urban roads are shot by using ordinary smart phone. The classification, recognition, tracking and counting of vehicles are realized by using a method of object detection and tracking based on YOLOv3. In the configured Python environment, YOLOv3 Algorithm can quickly and accurately classify and detect vehicles, and then it use Deep Sort tracking algorithm to classify and count all kinds of vehicles to obtain the number of each kind of vehicles in each frame. The types of more than 1 000 vehicles passing through the road section are counted. Combining with the existing vehicle mass data, the statistical weights of different types of vehicles are distributed and fitted respectively, and the representative value of the body mass of each type of vehicle is obtained. The vehicle load on the main road in any period is analyzed after substituting the mass representative value into the recognized counting result. The result shows that (1) The obtained vehicle mass representative value and the vehicle number distribution can be used to estimate the vehicle uniformly distributed load per frame on the road, and the distribution interval of the vehicle uniformly distributed load during each peak period can be obtained. (2) Comparing these values with the standard values of uniformly distributed load specified in the specification, it is found that at least 95% of the cases of uniformly distributed load will not exceed the standard value of uniform load specified in the specification, and they comply with the specification requirements in most of the time. (3) In the case of traffic congestion, the uniformly distributed load of vehicles will also exceed the standard value of specified uniformly distributed load. Therefore, using smart phones to capture videos anytime and anywhere can quickly and accurately classify and identify vehicles, and count the load on the road section, which can guide the measure of traffic volume limitation.

Key words: urban traffic classification and recognition YOLOv3 vehicle load smart phone tracking count

0 引言

随着我国经济及交通运输的快速发展，公路与桥梁的交通流量显著增长，伴随着这一增长趋势，交通荷载逐渐引起了人们的关注。如现在较为常见的超载现象，加快了公路和桥梁的疲劳及破坏。公路与桥梁的汽车设计荷载应与社会发展相适应。因此，对车辆荷载的监测与统计变得尤为重要^[1-3]。近年来，随着计算机视觉和深度学习的快速发展^[4]及其在土木工程领域的兴起^[5]，越来越多的研究学者开始关注基于计算机视觉的车辆检测，将计算机视觉技术与智能手机相结合，相比于传统的检测方法，以其非接触、速度快、精度合适、现场抗干扰能力强等突出的优点，得到了广泛应用^[6]。

常见的汽车荷载统计方法为车辆动态称重，即车辆动态称重(Weigh in Motion，简称WIM)系统，是指在车辆正常行驶过程中测量出车辆重量的过程。李占峰等^[7]以京港澳高速公路某路段的车辆为例，运用WIM系统对该路段的车辆荷载特征进行了数据采集。Kim等^[8]开发了一个基于WIM系统的描述车辆特性和交通流量的综合概率模型，用蒙特卡洛模拟方法评估了目标桥梁的交通荷载影响。宗周红等^[9]基于WIM系统的汽车荷载数据，统计了江苏省高速公路和桥梁上汽车荷载特性，建立了江苏省高速公路桥梁汽车荷载模型。但是这些研究都是基于WIM系统的，由于WIM系统成本较高，并未全面应用于我国各公路或桥梁上，所以完全靠WIM系统来统计车辆荷载是不经济的。目前，计算机视觉被广泛应用于各个科研领域，其中包括目标检测与跟踪的方法。Feng等^[10]提出了一种基于计算机视觉的非接触式车辆运动称量方法，通过计算机视觉系统测量轮胎与道路的接触长度和轮胎变形，为空载和满载卡车估计重量，这种方法将计算机视觉与物理原理结合运用。Dan等^[11]提出了一种用于监视整个桥面交通流量负荷的方法，将动态称重系统与计算机视觉技术相结合，布置在桥头的基于路面的动态称重系统用于获取由摄像机捕获的车辆重量，计算机视觉技术用于识别车辆的实时位置，但这种方法要求桥梁上预先具备WIM系统，才可实时测量负载值。He等^[12]运用计算机视觉技术自动检测并分类在佛罗里达州高速公路上行驶的卡车，但不足之处在于未将分类检测结果用于荷载统计分析中。在计算机视觉领域，目标检测算法中较为常用的就是近几年新兴的YOLO^[13]算法，大多数研究学者开始将其运用于车辆检测工作中。李珣等^[14]提出了一种基于Darknet框架下YOLOv2算法的车辆多目标检测方法。Shen等^[15]将YOLO等卷积神经网络框架用于联合检测车辆并有效估计车辆距离。谢金龙等^[16]运用YOLOv3及Deep Sort算法对道路进行了车流量检测，但也未将检测结果应用于荷载分析中。赵雪峰等^[17]将计算机视觉与智能手机相结合，利用智能手机进行图片收集，利用计算机视觉中的卷积神经网络进行了裂缝检测，其充分利用了智能手机和计算机视觉的优势，但对裂缝的检测仅限于图片检测。随着目标检测的广泛应用以及YOLOv3的提出，视频检测变得越来越快速且准确。

本研究提出了一种基于智能手机的城市道路车辆即时识别方法。本方法使用普通智能手机采集视频材料，运用计算机视觉技术对视频材料进行车辆的聚类检测并跟踪，并根据已有的汽车荷载数据，对某一时间段某一公路或桥梁的负载情况进行分析。最后，选取一条城市道路为研究对象，证明本方法的可行性和实用性，并对该道路是否限制交通流量给出建议。

1 YOLO算法

近年来，目标检测算法取得了很大的突破，比较流行的算法可以分为两类，一类是基于区域生成的R-CNN^[18]系算法，R-CNN，Fast R-CNN^[19]，Faster R-CNN^[20]等，这些算法是two-stage的，需要先由算法产生目标候选框，然后再对候选框进行分类与回归；另一类是YOLO，SSD这类one-stage算法，仅仅使用一个卷积神经网络CNN直接预测不同目标的类别和位置。

2016年，Redmon提出YOLO算法，YOLO成为计算机视觉领域最知名的目标检测算法之一，被业界广泛使用。YOLO的全称是You Only Look Once，与另一种著名的目标检测算法Fast R-CNN相比具有两大优势：(1)速度快：每秒45帧的检测速率，可用于实时视频检测中，在更小的模型上甚至达到155帧；(2)通用性好：在真实图像数据上训练的网络，可用于虚构的绘画作品上。但YOLO也存在局限性，其正确率没有Fast R-CNN高，每个检测框只能检测一个物体，边缘不规则的物体会影响到周围物体的识别。Redmon后来又在原始的YOLO技术上，发展出了YOLO9000^[21]，YOLOv3^[22]等算法，扩展了检测物的种类并提高了模型的准确率。

1.1 YOLOv3

YOLO是一种端到端的目标检测模型，其核心思想为：利用整张图作为网络的输入，直接在输出层回归边界框(Bounding Box)的位置及所属类别，在目前的目标检测中达到了最好的识别精度和速度的平衡。

YOLOv3的网络输入图片尺寸为416×416，将输入图像分为S×S个网格(Grid Cell)，如果某个对象的中心坐标落在某个网格中，就由该网格来预测这个对象。每个网格要预测B个边界框，每个边界框除了回归自身位置之外，还要预测一个置信度(Confidence Score)以及C个类别概率。其中，置信度反映检测框对检测结果的自信程度，其计算公式为：

(1)

式中，Pr(Object)为当前边界框中含有对象的置信度；IOU(Intersection over Union)为交并比，其计算为预测边框和真实边框的交集和并集的比值，表示当前边界框预测目标位置的准确性，如图 1所示。

图 1 交并比(IOU) Fig. 1 Intersection over union(IOU)

图选项

YOLOv3关于每个边界框的位置预测出中心点相对于网格单元左上角的相对坐标，分别为t_x，t_y，t_w，t_h，通过坐标偏移公式计算得到边框的位置大小。

(2)

(3)

(4)

(5)

式中，t_x，t_y，t_w，t_h为预测输出；c_x，c_y为网格的坐标，如某层的特征图大小为13×13，则网格就有13×13个，第1行第1列的坐标(c_x，c_y)就是(1，1)；p_w，p_h为预测前边界框的尺寸；b_x，b_y，b_w，b_h为得到的边界框的中心坐标和尺寸，具体见图 2。

图 2 坐标图 Fig. 2 Coordinate diagram

图选项

1.2 YOLOv3的网络结构

YOLOv3的主干结构是Darknet-53网络，其他预测支路都是采用全卷积的结构。YOLOv3的网络结构如图 3所示。

图 3 YOLOv3网络结构 Fig. 3 YOLOv3 network

图选项

其中，DBL是YOLOv3的基本组件。正如Darknetconv2D_BN_Leaky函数的定义，Darknet的卷积层后接Batch Normalization(BN)和LeakyReLU(激活函数)。除最后一层卷积层外，BN和LeakyReLU已成为卷积层不可缺少的部分，并和卷积层组成最小组件。resn中，n代表数字，有res1，res2, …，res8等，表示这个res_block(残差层)中包含多少个res_unit(残差单元)。这是YOLOv3的大组件，从YOLOv2的Darknet-19到YOLOv3的Darknet-53，YOLOv3加入了YOLOv2没有的残差网络，使网络结构更深。其中，res_block和res_unit的基本组件也是DBL。

YOLOv3采用上采样和融合做法，融合了3个尺度(13×13，26×26，52×52)，在多尺度融合特征图上分别做独立检测，使小目标的检测效果明显提高。

1.3 损失函数

在YOLO的运用中，损失函数(Loss Function)是非常重要的。但在YOLOv3的论文中，作者并没有明确提到所用的损失函数，只在YOLOv1中使用了一种叫作SSE(Sum-squared Error)的损失函数。SSE是一种常用的损失函数，只是简单的差方相加，易于优化。从YOLOv3的代码中可以看出，一部分的损失函数使用了二值交叉熵。损失函数由4部分组成：(1)对预测的中心坐标做损失；(2)对预测的宽高做损失；(3)对预测的类别做损失；(4)对预测的置信度做损失；其公式如下：

(6)

式中，第1项为对中心坐标的损失；第2项为宽高的损失；第3项为对含对象的边界框的置信度的损失；第4项为对不含对象的边界框的置信度的损失；第5项为对类别的损失；I_ij^obj为判断第i个网格的第j个边界框是否负责这个对象；I_i^obj为判断是否有对象中心落在第i个网格中; λ_coord为位置误差; λ_noobj为非对象误差。

2 Deep Sort跟踪算法

Deep Sort算法^[23]是在Sort算法的基础上改进的，在实时目标追踪过程中，提取目标的表观特征进行最近邻匹配，有效地改善了有遮挡情况下目标的追踪效果，同时减少了目标跳变的情形。

这种算法在运动状态估计方面使用8个参数来描述运动状态。其中，(u, v)为边界框的中心坐标；γ为长宽比；h为高度；其他4个参数为对应的图像坐标系的速度。使用一个基于常量速度模型和线性标准模型的标准卡尔曼滤波器进行目标运动状态的预测，结果为(u, v, γ, h)。

常见的关联检测结果和追踪预测结果的方法为匈牙利方法，这种Deep Sort算法同时考虑了运动信息的关联和目标外观信息的关联。运动信息的关联是指对已存在的运动目标的运动状态的卡尔曼预测结果与检测结果的关联。其中，马氏距离表示的是数据的协方差距离，是一种有效计算两个未知样本集相似度的方法。

(7)

式中，d⁽¹⁾为马式距离; d_j为第j个检测框的位置；y_i为第i个追踪器对目标的预测位置；S_i为检测位置与追踪位置之间的协方差矩阵。如果关联的马氏距离小于指定的阈值，则关联成功。另一种关联方法就是计算第i个追踪器的最近100个成功关联的特征集与当前帧第j个检测结果的特征向量间的最小余弦距离, 其计算公式为:

(8)

式中, d⁽²⁾为最小余弦距离; r_j^Tr_k⁽ⁱ⁾为余弦相似度; R_i为外观特征描述符集合。

如果这个距离小于指定的阈值，则这个关联是成功的。将两种关联方法的结果线性加权，作为最终的度量。

(9)

只有c_{i, j}位于两个阈值的交集内时，才认为关联成功。

3 基于智能手机的城市车辆即时识别方法

本研究提出的基于智能手机以及计算机视觉技术的城市道路车辆即时识别方法，是使用普通智能手机对城市道路行驶中的车辆拍摄视频，以YOLOv3算法实现初步的视频中车辆的分类检测，之后通过Deep Sort跟踪算法对各类车辆进行计数统计。根据各类车辆的数量统计结果以及分布拟合得到的汽车荷载代表值，统计出某一时段某一公路或桥梁的负载情况，对其结果进行分析，本方法的流程图如图 4所示。

图 4 流程图 Fig. 4 Flowchart

图选项

4 实例

对于本研究提出的基于智能手机的城市道路车辆即时识别方法，以一条普通城市道路的中间路段为例，分类统计该路段7 d内早中晚3个高峰期的车流量，并统计车辆荷载，对7 d内该路段进行荷载时程分析。由于该道路属于城市主干路，卡车禁止通行，所以本试验仅涉及中小型私家车和公共汽车。

4.1 数据集

本实例采用的数据集为COCO数据集^[24]，主要从复杂的日常场景中截取。该数据集提供的类别有80类，有超过33万张图片，其中20万张有标注，整个数据集中个体的数目超过150万个。其中，本研究的车辆检测只涉及到两种类别，即“car”，“bus”，在COCO数据集中提取车辆类别，并对YOLO的配置文件进行修改，重新编译，再进行训练。

4.2 试验平台

由于Darknet框架下的YOLOv3对数据集进行训练时，计算量较大，车辆检测过程中，需要处理的数据过多，所以本试验主要在服务器上完成。服务器的主要配置为：NVIDIA Quadro P5000显卡，显存容量16 GB，64 G内存。使用的语言为Python语言，在Pycharm平台上实现。试验样本采集于人行桥上，采集连续7 d的早中晚高峰期车辆视频。视频使用三星SM9209手机拍摄，分辨率为1 920×1 080，所以使用普通经济型手机即可，降低了对采集设备的要求。视频采集设备示意图如图 5所示。

图 5 采集设备 Fig. 5 Acquisition equipment

图选项

4.3 车重统计分析

大多数对车重的统计分析都是基于WIM称重系统的，但是WIM系统目前仅广泛用于桥梁及大型公路，对于这种城市主干道还没有普及。本实例统计了通过该路段的1 000多辆汽车的型号以及所载人数，并对统计结果进行分布拟合。其中，每辆车的车重取其出厂参数提供的整备质量，每位男性体重均取75 kg，女性体重均取55 kg，小孩体重均取30 kg。据此，认为小轿车、公交车的车重均服从偏态分布，分别对应的频率分布直方图如图 6所示。

图 6 车重频率分布直方图 Fig. 6 Histograms of vehicle weight frequency distribution

图选项

如图 6所示，小轿车、公交车的车重均服从偏态分布。为了与各类车的数量相结合，取各自的数学期望来反映平均取值的大小，小轿车车重的期望为1.727 t，公交车车重的期望为12.325 t。

4.4 车流量统计分析

本试验的研究对象为兰州市的一条城市道路，对其进行车辆识别计数。采集该道路连续7 d早中晚高峰期的车辆行驶视频，各1 min。对采集到的视频进行识别，得到的效果如图 7所示。

图 7 YOLOv3检测结果 Fig. 7 YOLOv3 test result

图选项

识别完毕，将每一帧检测到的小轿车和公交车的数量进行统计并进行分布拟合，得到1 min内每一帧各类车辆数量的频率分布直方图，通过比较，认为该道路7 d内每天同一时段通过的各类车的数量很近似，如图 8所示。

图 8 任意3 d同一时段同一类车的频率分布直方图 Fig. 8 Frequency distribution histograms of same type of vehicles in same period of any 3 days

图选项

图 8中，3 d同一时段的小轿车数量分布都大致相同，对7 d同一时段的小轿车数量进行统计，发现整体的频率分布直方图与与图 8大致相同，则认为某一天的偶然性没有对整体水平产生很大影响。7 d早高峰期小轿车数量的整体频率分布直方图如图 9所示。

图 9 七天早高峰期小轿车数量的整体频率分布直方图 Fig. 9 Overall frequency distribution histogram of number of cars in 7-day morning rush hour

图选项

如图 9所示，可得出早高峰期小轿车的数量主要分布在7~12 veh之间。各个时段各类车辆数量的频率分布直方图如图 10所示。

图 10 各个时段各类车辆数量的频率分布直方图 Fig. 10 Frequency distribution histograms of number of each type of vehicles in each period

图选项

如图 10所示，早高峰期公交车的数量主要分布在0~2 veh之间，午高峰期小轿车的数量主要分布在8~13 veh之间，午高峰期公交车的数量主要分布在0~2 veh之间，晚高峰期小轿车的数量主要分布在8~15 veh之间，晚高峰期公交车的数量主要分布在0~2 veh之间，如表 1所示。

表 1 各高峰期汽车数量分布区间 Tab. 1 Distribution range of automobile number in each rush hour

7 d整体分布	早高峰	午高峰	晚高峰
小轿车数量/veh	7~12	8~13	8~15
公交车数量/veh	0~2	0~2	0~2

表选项

综上所述，7 d的高峰期中，每一帧通过的小轿车数量集中于7~15 veh，最多可达到20 veh，而每一瞬间通过的公交车数量集中于0~2 veh，最多可达到5 veh。

4.5 代入荷载代表值

由相关系数公式计算可得出每一帧的小轿车数量与公交车数量的相关系数，得到早高峰期小轿车数量与公交车数量的相关系数为-0.268 2，午高峰期小轿车数量与公交车数量的相关系数为-0.264，晚高峰期小轿车数量与公交车数量的相关系数为-0.045 9，绝对值均小于0.3，则近似认为小轿车数量与公交车数量相互独立，不具有相关性。

将公交车、小轿车重量的期望值直接代入检测到的每帧公交车、小轿车数量的统计结果中，可得到每一帧的汽车总重量，如图 11所示。

图 11 各高峰期每帧汽车总重量统计 Fig. 11 Statistics of vehicle gross weight per frame in each rush hour

图选项

根据检测情况看出，所能检测到的路面范围长度约50 m，根据路面整体汽车荷载可求得其均布荷载，均布荷载的分布情况如图 12所示。

图 12 各高峰期每帧均布荷载频率分布直方图 Fig. 12 Frequency distribution histograms of uniformly distributed load per frame in each rush hour

图选项

如图 12所示，3个高峰期的每帧均布荷载分布在3~9 kN/m的情况较多。按照《公路桥涵设计通用规范》(JTG D60—2015)规定，公路—Ⅰ级车道荷载均布荷载标准值为q_k=10.5 kN/m，则该路段在车辆行驶高峰期的车辆荷载有时会超过规范规定的标准值。各高峰期每帧均布荷载符合规范标准值规定的概率如表 2所示。

表 2 各高峰期每帧均布荷载符合规定标准值的概率 Tab. 2 Probability of uniformly distributed load per frame in each rush hour meets specified standard value

项类	早高峰	午高峰	晚高峰
符合均布荷载标准值的概率/%	98.07	97.29	95.11

表选项

如表 2所示，每个高峰期的大部分时间内车辆荷载符合规范规定，但也会有超过规范规定的情况出现，而在晚高峰期超限情况更多一些。因此，为减缓交通压力并减少对道路路面的破坏，交通部门应在各个高峰期对本道路进行交通限制。

5 结论

本研究提出了一种基于智能手机的城市道路车辆即时识别方法，并运用这种方法对某一普通城市道路进行荷载分析，得到以下结论：

(1) 利用YOLOv3算法进行目标检测具有较高的准确性，可快速准确地进行目标检测和分类计数。

(2) 本方法使用的采集视频设备具有清晰、便携、简便以及经济等优点，可随时随地采集视频。

(3) 本方法得出的结论是基于大数据支持下的，对某一普通城市道路的荷载分析，为得到更为精确的道路车辆荷载信息，应与WIM系统得到的数据相结合。

(4) 本方法中的YOLOv3算法也存在一定误差，例如漏检、误检、复检等情况，之后还可尝试使用YOLOv4等方法进行完善；采集设备也有可能受到外界因素的干扰，例如风大时或人行桥的振动较大时，都会对视频拍摄效果有干扰。

参考文献

[1]	CATBAS F N, ZAURIN R, GUL M, et al. Sensor Networks, Computer Imaging, and Unit Influence Lines for Structural Health Monitoring: Case Study for Bridge Load Rating[J]. Journal of Bridge Engineering, 2012, 17(4): 662-670. DOI:10.1061/(ASCE)BE.1943-5592.0000288

[2]	CHEN Z C, LI H, BAO Y Q, et al. Identification of Spatio-temporal Distribution of Vehicle Loads on Long-span Bridges Using Computer Vision Technology[J]. Structural Control and Health Monitoring, 2016, 23(3): 517-534. DOI:10.1002/stc.1780

[3]	SUN B, XU Y L, WANG F Y, et al. Multi-scale Fatigue Damage Prognosis for Long-span Steel Bridges under Vehicle Loading[J]. Structure and Infrastructure Engineering, 2019, 15(4/5/6): 524-538.

[4]	卢宏涛, 张秦川. 深度卷积神经网络在计算机视觉中的应用研究综述[J]. 数据采集与处理, 2016, 31(1): 1-17. LU Hong-tao, ZHANG Qin-chuan. Applications of Deep Convolutional Neural Network in Computer Vision[J]. Journal of Data Acquisition & Processing, 2016, 31(1): 1-17.

[5]	ZAURIN R, CATBAS F N. Integration of Computer Imaging and Sensor Data for Structural Health Monitoring of Bridges[J]. Smart Materials & Structures, 2010, 19(1): 015019.

[6]	王宇宁, 庞智恒, 袁德明. 基于YOLO算法的车辆实时检测[J]. 武汉理工大学学报, 2016, 38(10): 41-46. WANG Yu-ning, PANG Zhi-heng, YUAN De-ming. Vehicle Detection Based on YOLO in Real Time[J]. Journal of Wuhan University of Technology, 2016, 38(10): 41-46. DOI:10.3963/j.issn.1671-4431.2016.10.008

[7]	李占峰, 吴庆雄, 陈康明. 基于WIM系统的重载车辆模型及其荷载效应分析[J]. 公路, 2019, 64(2): 147-155. LI Zhan-feng, WU Qing-xiong, CHEN Kang-ming. Heavy-duty Vehicle Model Based on WIM System and Its Load Effect Analysis[J]. Highway, 2019, 64(2): 147-155.

[8]	KIM J H, SONG J H. A Comprehensive Probabilistic Model of Traffic Loads Based on Weigh-in-Motion Data for Applications to Bridge Structures[J]. KSCE Journal of Civil Engineering, 2019, 23(8): 3628-3643. DOI:10.1007/s12205-019-2432-9

[9]	宗周红, 薛程, 杨泽刚, 等. 基于WIM的江苏省高速公路桥梁汽车荷载模型[J]. 东南大学学报(自然科学版), 2020, 50(1): 143-152. ZONG Zhou-hong, XUE Cheng, YANG Ze-gang, et al. Vehicle Load Model for Highway Bridges in Jiangsu Province Based on WIM[J]. Journal of Southeast University (Natural Science Edition), 2020, 50(1): 143-152.

[10]	FENG M Q, LEUNG R Y, ECKERSLEY C M. Non-contact Vehicle Weigh-in-Motion Using Computer Vision[J]. Measurement, 2020, 153: 107415. DOI:10.1016/j.measurement.2019.107415

[11]	DAN D H, GE L F, YAN X F. Identification of Moving Loads Based on the Information Fusion of Weigh-in-Motion System and Multiple Camera Machine Vision[J]. Measurement, 2019, 144: 155-166. DOI:10.1016/j.measurement.2019.05.042

[12]	HE P, WU A T, RANGARAJAN A, et al. Truck Taxonomy and Classification Using Video and Weigh-in-Motion (WIM) Technology Final Report, BDV31-977-81[R]. Tallahassee: The Florida Department of Transportation, 2019.

[13]	REDMON J, DIVVALA S, GIRSHICK R, et al. You Only Look Once: Unified, Real-time Object Detection[C]// Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition(CVPR). Las Vegas: IEEE, 2016: 779-788.

[14]	李珣, 刘瑶, 李鹏飞, 等. 基于Darknet框架下YOLO v2算法的车辆多目标检测方法[J]. 交通运输工程学报, 2018, 18(6): 142-158. LI Xun, LIU Yao, LI Peng-fei, et al. Vehicle Multi-target Detection Method Based on YOLO v2 Algorithm under Darknet Framework[J]. Journal of Traffic and Transportation Engineering, 2018, 18(6): 142-158.

[15]	SHEN C, ZHAO X M, LIU Z W, et al. Joint Vehicle Detection and Distance Prediction via Monocular Depth Estimation[J]. IET Intelligent Transport Systems, 2020, 14(7): 753-763.

[16]	谢金龙, 胡勇. 基于深度学习的车辆检测与跟踪系统[J]. 工业控制计算机, 2020, 33(7): 99-101. XIE Jin-long, HU Yong. Vehicle Detection and Tracking System Based on Deep Learning[J]. Industrial Control Computer, 2020, 33(7): 99-101.

[17]	赵雪峰, 李生元, 欧进萍. 基于人工智能与智能手机的混凝土裂纹检测[J]. 物联网技术, 2017, 7(8): 15-18. ZHAO Xue-feng, LI Sheng-yuan, OU Jin-ping. Concrete Crack Detection Based on Artificial Intelligence and Smart Phone[J]. Internet of Things Technologies, 2017, 7(8): 15-18.

[18]	GIRSHICK R, DONAHUE, J, DARRELL T, et al. Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation[C]// Proceedings of the 2014 IEEE Conference on Computer Vision and Pattern Recognition(CVPR). Columbus: IEEE, 2014: 580-587.

[19]	GIRSHICK R. Fast R-CNN[C]// Proceedings of the 2015 IEEE International Conference on Computer Vision(ICCV). Santiago: IEEE, 2015: 1440-1448.

[20]	REN S Q, HE K M, GIRSHICK R, et al. Faster R-CNN: Towards Real-time Object Detection with Region Proposal Networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(6): 1137-1149.

[21]	REDMON J, FARHADI A. YOLO9000: Better, Faster, Stronger[C]// Proceedings of the 2017 IEEE Conference on Computer Vision and Pattern Recognition(CVPR). Honolulu: IEEE, 2017: 6517-6525.

[22]	REDMON J, FARHADI A. YOLOv3: An Incremental Improvement, 2018arXiv180402767R[R]. Ithaca: arXiv, 2018.

[23]	WOJKE N, BEWLEY A, PAULUS D. Simple Online and Realtime Tracking with a Deep Association Metric[C]// Proceedings of the 2017 IEEE International Conference on Image Processing(ICIP). Beijing: IEEE, 2017: 3645-3649.

[24]	赵永强, 饶元, 董世鹏, 等. 深度学习目标检测方法综述[J]. 中国图象图形学报, 2020, 25(4): 629-654. ZHAO Yong-qiang, RAO Yuan, DONG Shi-peng, et al. Survey on Deep Learning Object Detection[J]. Journal of Image and Graphics, 2020, 25(4): 629-654.