扩展功能
文章信息
- 黄思德, 黄荣军, 张岩坤, 刘清河.
- HUANG Si-de, HUANG Rong-jun, ZHANG Yan-kun, LIU Qing-he
- 基于监控视频的交通事故自动识别算法
- An Algorithm for Automatic Traffic Incident Detection Based on Surveillance Video
- 公路交通科技, 2024, 41(1): 169-176
- Journal of Highway and Transportation Research and Denelopment, 2024, 41(1): 169-176
- 10.3969/j.issn.1002-0268.2024.01.019
-
文章历史
- 收稿日期: 2021-11-12
2. 哈尔滨工业大学(威海) 汽车工程学院, 山东 威海 264209
2. School of Automotive Engineering, Harbin Institute of Technology(Weihai), Weihai Shandong 264209, China
随着中国道路交通的飞速发展,车辆急剧增多,每年因为交通事故造成的生命财产损失也快速增长。近年来,我国每年因为交通事故造成的直接财产损失超过10亿元,死亡超过6万人。
交通事故发生后,一般只能依靠当事人或目击者进行报警救助,交警部门才能得知事故的发生,并到现场进行事故调查,需要查阅监控视频时,还需要到监控中心在海量的视频文件中进行人工调阅处理。这种方法实时性较差,不能及时掌握交通事故的准确信息。肇事车辆和伤者会停留在道路上等待处理和救援,占用车道导致交通拥堵,易导致二次事故。据近年来的统计数据,20%~30%的交通事故是二次事故,将近一半的二次事故是在交通事故发生后10 min内衍生的[1]。因此, 交通事故的快速识别和信息提取,及时报警并发出救援信号,可以大幅度提高事故处理的速度,缓解拥堵并降低人员财产损失。
交通事故的自动识别一直是交通领域的重要课题,早在20世纪60年代纽约政府于林肯隧道建立了世界上最早的自动检测事件的系统[2]。随着交通领域各项技术的快速发展,特别是智慧交通系统的快速推进,国内外众多的学者对该问题进行了广泛研究。目前,交通事故的自动识别方法主要分为两大类:基于交通流数据的间接法和基于实时监控视频的直接法。
间接法提出的时间较早,目前也应用的更为广泛。由于早期的交通系统中,数据获取的能力较弱,只有地感线圈、超声波检测等装置能提供道路上车辆的流量信息,因此,事故识别的算法也多在此类数据基础上提出。典型的如早期的加州算法、标准偏差算法、指数平滑算法等[3],其主要原理是通过对交通流数据的突变获取该路段的交通事故信息。近年来,人工智能和模式识别技术也在该领域获得了较为成功的应用。施俊庆等[4]采用CNN网络建立了交通流数据与交通事件的映射关系;Zhu等[5]采用模糊逻辑改善了极端天气下的事故检测精度。Jiang等[6]采用车速等交通流数据训练长短时神经网络以实现交通事故的检测。还有一些学者尝试了贝叶斯推理[7]、部分最小二乘法[8-9]、支持向量机[10]等方法实现交通事故的自动检测。
直接法主要依赖于当前智能交通系统大量应用的监控摄像头数据,其事故检测的方法主要依赖于机器视觉技术。在此类算法中,可以分成两种技术路线:运动特征检测法和图像特征检测法。运动特征检测法首先在视频中识别并跟踪各交通目标,获取各目标的运动轨迹和状态,通过各种时空条件推理各目标间是否发生交通事故。Wang等[11]采用YOLOv3实现目标识别后通过决策树实现事故的自动判断。另一方面,图像特征检测法则放弃了对图像内各目标的检测和跟踪,而是通过抓取多帧连续图像的某种场函数或视觉特征的变化检测是否发生交通事故。刘松[12]通过对图像的相干运动场获取事故过程的识别;梁帅[13]则通过局部运动方向图的高斯模型获得交通事故的特征提取。Lu等[14]则直接通过LSTM网络对图像中的高碰撞风险区进行提取,并根据风险程度进行事故判断。表 1对两种事故识别算法进行了详细对比分析。
| 事故识别方法 | 数据来源 | 能够输出的特征信息 | 实时性 | 识别率 | 虚警率 | |
| 间接法 | 地感线圈,电磁检测等 | 有无事故,事故大概时间和地点 | 滞后,非实时 | 低 | 低 | |
| 直接法 | 运动特征检测法 | 监控摄像头 | 有无事故,事故精确时间地点,事故各方运动信息 | 实时 | 高 | 较高 |
| 图像特征检测法 | 监控摄像头 | 有无事故,事故精确时间地点 | 实时 | 高 | 低 | |
基于交通流数据的间接法在研究成果和应用方面较为普遍和成熟[15-17]。然而其显著的缺点是仅能在交通事故对道路交通流产生显著影响后才能实现事故事件的检测,无法提取事故参与方的具体特征和信息,对交通事故的快速处理和救援意义有限,主要用于交通指挥系统领域。
基于实时监控的直接法能够获取精确的事故时间和地点。不仅如此,运动特征检测还能够自动提供事故参与方的速度、轨迹等更为具体化的信息,尤其适合服务与快速的事故责任认定和快速处理[18-19]。因此,本研究针对此类方法进行研究,采用YOLOv3深度卷积神经网络提高交通目标识别和轨迹提取的精度,基于时空冲突原则提出事故自动识别算法,实现基于监控视频的交通事故自动识别系统。为了解决该算法虚警率高的问题,提出基于车辆细节提取的特征描述矩阵并应用于deepSORT改进目标跟踪的精度。
1 交通事故自动识别算法总体流程为了在事故自动识别的同时,能够同时获取事故参与方的运动轨迹、速度状态等信息,本研究建立了以目标识别和跟踪为基础的事故识别算法,算法的基本流程简述如下:
(1) 算法的输入为交通监控摄像头的实时视频流,经GPU解码后获取每秒25帧的图像。
(2) 将图像送入YOLOv3目标检测神经网络后获得多个交通目标的外包围框和目标类别。
(3) 为了提升后期车辆定位和轨迹跟踪的精度,在每个识别框内检测车轮、车窗和车牌这3种典型子特征的位置,并为每个对象建立子特征描述矩阵。
(4) 采用目标包围框的交并比(Intersection over Union,IoU)和子特征矩阵的曼哈顿距离进行级联匹配,改进deepSORT算法,实现多目标跟踪。
(5) 对不同的对象自适应的选择特征点,对目标跟踪的轨迹进行特征计算和提取,获取目标的运动速度、方向等信息。
(6) 以交通冲突为基本原则,建立事故自动识别算法,输出事故判断结果,并同时输出事故参与方的具体运动特征。
上述的事故自动识别算法流程如图 1所示。
|
| 图 1 基于视频监控的交通事故自动识别算法流程 Fig. 1 Flow chart of AID algorithm based on video surveillance |
| |
2 基于监控视频的多目标检测技术
得益于近年来卷积神经网络技术的兴起,基于视觉的目标检测技术取得了长足的进步,检测的准确率大幅度提升。为了兼顾检测的准确率和视频处理的实时性,本研究采用YOLOv3[20]网络实现监控视频内交通参与者的多目标检测。
由于YOLOv3采用了多尺度预测的方式, 标准的YOLOv3网络共有3个输出。通过对众多的交通监控视频分析发现,能够获得有意义的监控信息的交通参与物一般都具有较大的图像面积。因此为了获得更好的算法实时性,将原YOLOv3网络中针对小目标检测的53×53网格划分的预测分支剪除,修改之后的网络结构图如图 2所示。图 2中DBL组件是网络的基本组件,每个DBL组件都是由1个卷积层、1个批量归一化层、1个LeakyReLU激活函数层组成。Concat为张量拼接操作,即将两个张量拼接起来,形成一个高纬度的张量。
|
| 图 2 减除小目标检测网络的YOLOv3网络结构 Fig. 2 YOLOv3 neural network subtracted small object detection |
| |
针对交通监控视频中的常见交通参与者的图像特征,将需要检测的目标分成8类,分别为人、两轮车、三轮车、轿车、越野车、小货车、大客车、大货车。其中轿车和越野车的主要区别是3厢和两厢,小货车主要指两轴的小货或者厢式货车,大货车主要指多轴以上的货车和拖挂车等。
通过网上公开的事故视频和与交通管理部门合作,本研究选取了各类不同时段、不同天气、不同角度的50多个各类交通监控视频进行了神经网络训练集的制作。截取了13 000多张图片,每张图片手工标注了几个到几十个不等的数据标签,对YOLOv3网络进行了训练。采用隔离的2 000张图片作为检验集对获得的权重文件进行检测准确度测试,所获得的识别率如表 2所示。
| 识别目标类型 | 识别率/% |
| 大货车(heavytrack) | 88.53 |
| 轿车(car) | 89.06 |
| 客车(coach) | 85.89 |
| 两轮车(bicycle) | 85.44 |
| 越野车(SUV) | 90.25 |
| 三轮车(tricycle) | 89.64 |
| 行人(person) | 77.23 |
| 小货车(truck) | 88.19 |
| 平均识别率mAP | 88.10 |
3 车辆特征描述矩阵及其距离
YOLOv3网络虽然能够较好的完成目标检测,然而其输出仅有检测框和目标类别两个信息,在用于多目标跟踪时,很容易在遮挡或漏识别时发生跟踪丢失。deepSORT算法[21]通过嵌入ReID网络和相似度匹配能够改善跟踪效果,但是计算量太大,很难实现实时的多目标跟踪。
交通事故发生时,基本上都存在车辆的参与,且车辆在视频中运动时基本表现为刚体,内部无相对运动。因此,本研究对YOLOv3输出的车辆类型目标进行车轮、车牌和车窗3种细节特征进行提取,并利用细节特征的提取结果建立车辆的特征描述矩阵,根据特征描述矩阵的曼哈顿距离对车辆进行deepSORT跟踪。
如图 3所示的两帧监控视频图像。在图 3(a)中,YOLOv3网络获取了白色轿车的包围框,ABCD分别为包围框的4个顶点。在白色轿车的识别框内识别出了两个车轮, 点E,F分别表示其中心点。由此6个顶点组成一个各点之间两两可达的无向图,两点之间的代价定义为图像平面内的直线距离。本研究将此无向图的代价矩阵为该车辆的特征描述矩阵。同时,为了方便求取两辆车特征描述矩阵之间的曼哈顿距离,定义生成无向图的代价矩阵时,各点之间按x方向坐标增序排列。对于x坐标相等不同点,则按y坐标增序排列,因此,本帧图像的有序点集为{A, B, E, F, D, C},记为{Pi}(i=1~6)。本研究将该车辆的特征描述矩阵如式(1)所示:
|
(1) |
式中,|PiPj|为Pi和Pj两点之间的直线距离, 当i=j时,|PiPj|=0。
在第2帧图像图 3(b)中,如果获取了此白色轿车的包围框和内部同样数量的车轮、车窗等细节特征,则两次的特征矩阵维度相等,可以直接求取曼哈顿距离。然而,由于目标识别的精度有限,容易发生细节特征提取不完全对应的情形。假设在第2帧图像中识别出两个车轮和两个车窗。此时的有序点集变为{A, B, E, F, H, G, D, C}, 两次的特征矩阵无法直接求取曼哈顿距离。为此将第2帧图像中的有序点集中任意删除2个点,共产生C82=28个新的有序点子集和对应的子特征描述矩阵。分别求第1帧图像的特征描述矩阵与第2帧的36个子特征描述矩阵的曼哈顿距离,将其最小值作为两幅图像特征描述矩阵的距离。
|
| 图 3 车辆特征描述矩阵示意图 Fig. 3 Schematic diagram of vehicle feature description matrix |
| |
4 混合型deepSORT多目标跟踪
由于交通事故的发生基本都离不开车辆的参与,因此为了兼顾事故识别的准确度和实时性,本研究仅对车辆类目标定义了简化特征提取算法和特征描述矩阵。为此,本研究分别采用deepSORT算法完成车辆类对象的目标跟踪,deepSORT算法完成行人、两轮车和三轮车的目标跟踪。因此,本研究的混合型deepSORT多目标跟踪算法结构如图 4所示。
|
| 图 4 混合型deepSORT多目标跟踪算法框图 Fig. 4 Block diagram of hybrid deepSORT algorithm |
| |
由于车辆类的目标基本上都为视觉上的刚体,在本研究定义的特征描述矩阵的物理意义下基本存在较为明显的相似性。因此,本研究的跟踪算法首先对车辆类的目标进行第1级特征矩阵匹配,匹配成功的对象直接用于卡尔曼滤波器的更新和跟踪器的更新。对于部分未能直接通过特征矩阵完成匹配的对象,跟非车辆类对象一起进行交并比匹配,直接采用deepSORT算法实现后续卡尔曼滤波器和跟踪器的更新。
典型的跟踪过程如图 5所示。
|
| 图 5 多目标跟踪算法效果 Fig. 5 Schematic diagram of multi-object tracking algorithm |
| |
(1) 对第1帧使用目标检测模型进行目标检测,得到第1帧中所有目标的位置,并对车辆类的目标提取特征描述矩阵, 图 5(a)第1帧图片中的左、中、右方框所示,为每一个目标生成一个跟踪器序号(ID)和卡尔曼滤波器。
(2) 对第2帧使用目标检测模型进行目标检测,得到第2帧中所有目标的位置和特征描述矩阵。同时根据卡尔曼滤波器预测出上一帧的3个目标所在的位置。根据需要使用特征描述矩阵或者检测框区域的交并比(IoU)实现目标匹配,并根据匹配的结果更新卡尔曼滤波器和跟踪器。
(3) 重复步骤2处理第3帧图像。
本研究采用目标跟踪的准确度MOTA测试跟踪算法的性能,MOTA的具体计算方法如式(2)所示。
|
(2) |
式中,FN和FP分别为漏报和误报目标的个数;IDSW为目标ID改变的次数;GT为所有标注目标的个数。
分别选用晴天、雨天和夜晚这3种视频,获得如表 3所示的测试数据。
| 视频 | 总目标数 | IDSW | FN | FP | MOTA |
| 晴天1 | 214 | 2 | 19 | 0 | 0.90 |
| 晴天2 | 265 | 2 | 18 | 0 | 0.92 |
| 雨天1 | 280 | 3 | 62 | 2 | 0.76 |
| 雨天2 | 134 | 3 | 33 | 3 | 0.71 |
| 夜晚1 | 130 | 2 | 32 | 1 | 0.73 |
| 夜晚2 | 68 | 1 | 15 | 1 | 0.75 |
5 交通事故自动识别算法
在实现目标检测与跟踪的基础上,对交通事故进行识别的方法一般有:速度法、轨迹法和交通冲突法。其中速度法和轨迹法一般关注于单个对象,通过提取速度和轨迹的异常特征来判断该对象发生了交通事故。交通冲突法则通过检验各运动目标的运行轨迹是否存在时空冲突来判断发生事故的可能性。
需要特别注意的是,以上3种方法的效果都对目标识别和跟踪算法的性能有强烈的依赖。特别是速度法和轨迹法,依赖性更强。通过对大量的案例进行分析和测试发现,事故发生瞬间,由于事故参与方的剧烈运动和相互遮挡,大概率会存在部分跟踪器ID丢失的现象。单独采用速度法和轨迹法很容易产生误报而导致算法事故识别率偏低,虚警率过高。因此,本研究的事故识别的算法主要建立在两个基本原则下:
(1) 视频监控中通过多目便检测和跟踪获取的各交通参与方在时间和空间上存在交通冲突的基本原则上进行。典型的状态为两辆车的运动轨迹存在空间上的交叉点,并且两辆车同一个时间到达了该交叉点或者与交叉点之间的距离小于预先设定的阈值。
(2) 事故发生时,由于目标检测采用基于视频的神经网络算法,因此容易发生事故后相互遮挡而导致的目标消失。经过大量的测试,本研究建立了以交通冲突为主判据,速度和轨迹特征为辅助判据的方法实现对交通事故的自动识别,所建立的识别算法流程如图 6所示。
|
| 图 6 基于时空冲突阈值的事故自动判断流程 Fig. 6 AID process based on spatio-temporal conflict threshold |
| |
选取典型案例之一进行事故识别过程的分析说明。如图 7(a)中,1 701为当前图像的帧数,算法识别并成功跟踪了17#和18#ID两个目标,拟合的轨迹交叉与两者轨迹的前方。然而ID17尚未满足距离阈值(圆圈)所限定的区域。当图 7(b)的1 711帧时,两者ID均进入距离阈值内。当图 7(c)的1 725帧时,碰撞剧烈发生,ID17由于遮挡和运动规律剧烈改变,跟踪器无法持续捕捉ID17,导致ID17跟踪器消失。
|
| 图 7 典型事故自动判断识别过程示例 Fig. 7 Example of typical AID process |
| |
通过多方获取交通事故监控视频,本研究对50个事故视频进行了事故识别测试,测试的统计数据如表 4所示。测试表明,本研究所建立的基于目标跟踪的事故识别算法获得了较高的事故识别准确率和较低的虚警率。
| 事故类型 | 案例数 | TP | FN | FP | 准确率/% | 虚警率/% |
| 车车事故 | 22 | 20 | 4 | 2 | 83 | 9 |
| 人车事故 | 28 | 20 | 0 | 8 | 71 | 0 |
| 总计 |
50 | 40 | 4 | 10 | 80 | 8 |
6 结论
基于目标检测和跟踪的交通事故直接识别方法一直受制约于目标检测和跟踪精度较低的缺陷而迟迟未能获得令人满意的效果。本研究并改进了基于YOLOv3的快速目标识别网络, 保证了交通视频输入下目标检测的实时性。同时,提出了一种基于无向图的车辆类目标特征描述矩阵表达方法,并在此基础上实现了快速的混合deepSORT的级联特征匹配,获得了实时性和精度均较高的目标检测和跟踪算法。以此为基础针对性地设计了基于轨迹和运动特征的时空冲突事故自动识别算法,取得了较高的事故识别精度,并保证了较低的虚警率。
| [1] |
吴国栋. 基于视频图像的人-车碰撞事故识别研究[D]. 郑州: 郑州大学, 2019. WU Guo-dong. Research of the Recognition of Human-vehicle Coliison Based on Video Image[D]. Zhengzhou: Zhengzhou Universtiy, 2019. |
| [2] |
COLLINS S, VERSAVEL J. Improving Road and Tunnel Safety Via Incident Management: Implementing a Video Image Processing System[C]// European Congress and Exhibition on Intelligent Transport Systems and Services. Geneva: ITS Europe, 2007.
|
| [3] |
高铭. 基于深度学习的复杂交通环境下目标跟踪与轨迹预测研究[D]. 长春: 吉林大学, 2020. GAO Ming. Research on Target Tracking and Trajectory Prediction in Complex Traffic Environment Based on Deep Learning[D]. Changchun: Jilin University, 2020. |
| [4] |
施俊庆, 陈林武, 李素兰, 等. 基于CNN的城市道路交通事件检测算法[J]. 公路交通科技, 2022, 39(3): 176-182. SHI Jun-qing, CHEN Lin-wu, LI Su-lan, et al. Urban Road Traffic Incident Detection Algorithm Based on CNN[J]. Journal of Highway and Transportation Research and Development, 2022, 39(3): 176-182. DOI:10.3969/j.issn.1002-0268.2022.03.022 |
| [5] |
ZHU C, GUO Z, KE J. Advanced Fuzzy-logic-based Traffic Incident Detection Algorithm[J].
Advances in Fuzzy Systems, 2021(12): 1-11.
|
| [6] |
JIANG F F, YUEN K K R, LEE E W MING. A Long Short-term Memory-based Framework for Crash Detection on Freeways with Traffic Data of Different Temporal Resolutions[J].
Accident Analysis & Prevention, 2020, 141: 105520.
|
| [7] |
GREGORIADES A, MOUSKOS K C. Black Spots Identification through a Bayesian Networks Quantification of Accident Risk Index[J].
Transportation Research Part C: Emerging Technologies, 2013(28): 28.
|
| [8] |
WANG X, CHEN S, ZHENG W. Traffic Incident Duration Prediction Based on Partial Least Squares Regression[J].
Procedia-social and Behavioral Sciences, 2013, 96: 425.
DOI:10.1016/j.sbspro.2013.08.050 |
| [9] |
LU J, CHEN S, WANG W, et al. A Hybrid Model of Partial Least Squares and Neural Network for Traffic Incident Detection[J].
Expert Systems with Applications, 2012, 39: 4775.
DOI:10.1016/j.eswa.2011.09.158 |
| [10] |
孙然然, 张静萱, 朱广宇. 基于SVM的危险交通流状态实时识别模型[J]. 公路交通科技, 2021, 38(10): 120-128. SUN Ran-ran, ZHANG Jing-xuan, ZHU Guang-yu. A Real-time Recognition Model of Dangerous Traffic Flow State Based on SVM[J]. Journal of Highway and Transportation Research and Development, 2021, 38(10): 120-128. DOI:10.3969/j.issn.1002-0268.2021.10.016 |
| [11] |
WANG C, DAI Y L, ZHOU W, et al. A Vision-based Video Crash Detection Framework for Mixed Traffic Flow Environment Considering Low-visibility Condition[J].
Journal of Advanced Transportation, 2019, 2020(9): 9194028.
|
| [12] |
刘松. 基于视频的车辆碰撞检测方法研究[M]. 重庆: 重庆大学, 2017. LIU Song. Research on Vehicle Collision Detection Method Based on Video[M]. Chongqing: Chongqing University, 2017. |
| [13] |
梁帅. 基于机器视觉的交通异常事件检测算法研究[M]. 成都: 电子科技大学, 2017. LIANG Shuai. Research on Traffic Anomaly Detection Algorithm Based on Machine Vision[M]. Chengdu: University of Electronic Science and Technology, 2017. |
| [14] |
LU Z B, ZHOU W, ZHANG S X, et al. A New Video-based Crash Detection Method: Balancing Speed and Accuracy Using a Feature Fusion Deep Learning Framework[J].
Journal of Advanced Transportation, 2020(24): 1-12.
|
| [15] |
YOUNG W, SOBHANI A, LENNÉ M G, et al. Simulation of Safety: A Review of the State of the Art in Road Safety Simulation Modelling[J].
Accident Analysis & Prevention, 2014, 66(3): 89-103.
|
| [16] |
KARLAFTIS M G, VLAHOGIANNI E I. Statistical Methods Versus Neural Networks in Transportation Research: Differences, Similarities and Some Insights[J].
Transportation Research Part C: Emerging Technologies, 2011, 19(3): 387-399.
DOI:10.1016/j.trc.2010.10.004 |
| [17] |
MA C, HAO W, WANG A, et al. Developing a Coordinated Signal Control System for Urban Ring Road under the Vehicle-infrastructure Connected Environment[J].
IEEE Access, 2018, 6: 52471.
DOI:10.1109/ACCESS.2018.2869890 |
| [18] |
VIVENTE E M A, ELIAN L R. Fast Car Crash Detection in Video[C]// Proceedings of the 2018 XLIV Latin American Computer Conference (CLEI). Sao Paulo: IEEE, 2018: 632-637.
|
| [19] |
LEE K B, SHIN H S. An Application of a Deep Learning Algorithm for Automatic Detection of Unexpected Accidents under Bad CCTV Monitoring Conditions in Tunnels[C]// Proceedings of the 2019 International Conference on Deep Learning and Machine Learning in Emerging Applications (Deep-ML). Istanbul: [s.n.], 2019: 7-11
|
| [20] |
李晶, 黄山. 基于YOLOv3目标跟踪方法[J]. 电光与控制, 2019, 26(10): 87-93. LI Jing, HUANG Shan. YOLOv3 Based Object Tracking Method[J]. Electronics Optics & Control, 2019, 26(10): 87-93. |
| [21] |
BEWLEY A, GE Z, OTT L, et al. Simple Online and Real time Tracking[C]// 2016 IEEE International Conference on Image Processing (ICIP). Phoenix: IEEE, 2016: 3464-3468.
|
2024, Vol. 41

