公路交通科技  2023, Vol. 40 Issue (3): 209-218

扩展功能

文章信息

王启明, 胥津铭, 苏建, 宗高强, 薛牟宇
WANG Qi-ming, XU Jin-ming, SU Jian, ZONG Gao-qiang, XUE Mou-yu
基于改进ALexNet模型的路面状况识别方法研究
Study on Pavement Condition Recognition Method Based on Improved ALexNet Model
公路交通科技, 2023, 40(3): 209-218
Journal of Highway and Transportation Research and Denelopment, 2023, 40(3): 209-218
10.3969/j.issn.1002-0268.2023.03.025

文章历史

收稿日期: 2021-03-05
基于改进ALexNet模型的路面状况识别方法研究
王启明1 , 胥津铭1 , 苏建2 , 宗高强1 , 薛牟宇1     
1. 上海理工大学 机械工程学院, 上海 200093;
2. 吉林大学 交通学院, 吉林 长春 130022
摘要: 针对目前路面类型识别率低及人工提取路面图像特征过程复杂且提取方法较为单一等问题, 提出了一种基于改进AlexNet模型的路面状况识别方法(PCRM)。首先, 结合路面图像样本的特征, 将ReLU激活函数改为LeakReLU, 添加了正则化层BN, 克服原有AlexNet网络显存的缺点。其次, 将改进的AlexNet网络进行了迁移学习, 冻结了ImageNet预训练的浅层网络权重, 替换原有的3层全连接层为2层全连接层并在路面图像数据集进行了训练, 用以提高网络训练效率和识别准确率。最后, 在改进的ALexNet网络中用6-label SoftMax代替原分类器, 进行WetAsphalt, Mud, Snow, Asphalt, Paved, Unpaved等6种路面类型分类, 其中后3类Asphalt, Paved和Unpaved样本数据集最容易相互误判。对比原有的AlexNet网络, 提出的PCRM模型验证集准确率提升了2.9%, 验证数据集损失值降低了0.555 4。从适应性、预测输出、误差性能等方面又对比分析了传统机器学习和本研究提出的PCRM模型。结果表明: 后者识别精确率为99.9%, 分别高于AlexNet, BP和SVM等分类模型3.3%, 7.1%和11.81%, 有效地提高了网络训练速度和道路图像识别精度, 具有较强的鲁棒性, 且能够满足多种实际路况路面图像的感知要求。该研究方法不只适用于单车道路识别, 可推广至人-车-路-云协同感知车辆环境。
关键词: 智能交通     路面状况识别     深度学习     迁移学习     环境感知    
Study on Pavement Condition Recognition Method Based on Improved ALexNet Model
WANG Qi-ming1, XU Jin-ming1, SU Jian2, ZONG Gao-qiang1, XUE Mou-yu1    
1. School of Mechanical Engineering, University of Shanghai for Science and Technology, Shanghai 200093, China;
2. School of Transportation, Jilin University, Changchun Jilin 130022, China
Abstract: In view of the problems of low recognition rate of pavement type, complex process of manual extraction of pavement image features and single extraction method, a pavement condition recognition model (PCRM) based on improved AlexNet model is proposed. First, combined with the characteristics of pavement image samples, the ReLU activation function is changed to LeakReLU and the regularization layer BN is added to overcome the shortcomings of the original AlexNet network memory. Second, the transferred learning on the improved AlexNet network is conducted, the shallow network weight of ImageNet pre-training is frozen, the original 3-layer full connection layer is replaced by 2-layer full connection layer and trained in the road image data set to improve the network training efficiency and recognition accuracy. Finally, in the improved ALexNet network, the original classifier is replaced by 6-label SoftMax to classify 6 types of pavement, including WetAsphalt, Mud, Snow, Asphalt, Paved, and Unpaved. Among them, the last 3 sample data sets (Paved, Unpaved and Asphalt) are most likely to be misjudged each other. Compared with the original AlexNet network, the accuracy of the proposed RSME model verification set is improved by 2.9%, and the loss value of the verification data is reduced by 0.555 4. The traditional machine learning and the proposed RSME model are compared and analyzed from the aspects of adaptability, prediction output and error performance. The result shows that the recognition accuracy of the latter is 99.9%, which is 3.3%, 7.1% and 11.81% higher than those of the classification models of AlexNet, BP and SVM, which effectively improved the network training speed and road image recognition accuracy. It has strong robustness, and can meet the perception requirements of a variety of actual road surface images. This research method is not only applicable to single vehicle road recognition, but also can be extended to human-vehicle-road-cloud collaborative perception of vehicle environment.
Key words: ITS     condition recognition     deep learning     transfer learning     environmental perception    
0 引言

汽车保有量的不断攀升,交通堵塞、安全事故等呈现上升态势。据统计[1-2]16.12%的高速公路交通事故因湿滑路况和驾驶员对路面损坏地形的反应延迟所致。结合自主车辆智能化发展要求,这就需要车辆能够主动准确识别当前行驶路面状况,这对智能驾驶车辆的动力性、舒适性和安全性起着重要作用。

20世纪60年代,Wiesel等[3]在研究猫大脑皮层用于局部敏感性和方向选择的神经元时发现它们独特的网络结构可有效降低反馈神经网络的复杂性,并提出了卷积神经网络(Convolutional Neural Network,CNN)。Lecun等[4]利用CNN在光学字符识别和计算机视觉方面取得了重大突破。近年来,CNN在众多领域有着广泛应用,尤其是图像目标检测[5-7]和分类[8-9]方面。CNN的出现为路况类型识别提出了一种新的解决思路。目前许多研究者和机构都致力于路面类型识别和附着系数预测。陈等[10]提取了路面图像灰度共生矩阵的特征参数取得一定效果,但该方法仍存在图像特征少、识别精度低等缺点。Bekhtike等[11]利用高斯过程回归函数逼近得到路面的纹理属性,并将道路纹理特征和运动得到的振动数据融合预测道路类型,此方法局限在于光照条件变化、运动视糊或者雨雪冰覆盖路面时较难准确识别道路类型。Ward等[12]利用加速度传感器成功地对沥青、铺面和砾石道路进行了分类,局限在于路面不平度相近时分类准确率下降。Alonso等[13]提出了一种基于轮胎噪声的实时声学路面状态识别系统,利用噪声测量系统和信号处理算法对路面状态进行分类,实现了湿、干路面状态的准确分类。Neupane等[14]提出了一种基于启发式激光雷达的路面类型检测方法,并通过激光反射强度的均值和方差来识别路面类型,该方法主要用于沥青路面。Jonsson等[15]提出了基于近红外相机图像光谱分析的道路分类方法,利用KNN和支持向量机(SVM)方法对干、湿、冰、雪道路进行分类取得了一定效果。Bystrov等[16]利用超声波传感器分析反射的超声波信号进行道路分类,识别准确率达89%。王世峰等[17]提出了一种基于机器学习基本原理的方法,融合了垂向加速度传感器信号和路面图像特征的数据对路面类型进行分类,受限于样本量准确率仅达到90%。万等[18]基于高维特征和RBF神经网络对道路图像进行分类和鉴别,识别8种不同道路图像准确率约为78.4%。赵等[19]通过PSO参数优化得到了最佳路面状况分类模型,并对5种基本道路类型的识别准确率达到90%以上。Casselgren等[20]研究了被雨、冰或雪覆盖的沥青路面的光性能,详细研究了光线强度随入射角和光谱的变化,并提出了采用两种不同波段对路面类型进行分类。Linton等[21]提出基于车辆图像数据与道路气象信息联网的道路状况监测解决方案。Jokela等[22]提出了一种监测和检测道路状况(冰、水、雪和沥青路面)的方法并开发了可检测光从路面反射时偏振变化的装置,利用纹理分析估计图像的对比度,提高了路面类型识别精度,但仍存在环境适应性较差的问题。Kang等[23]和Yu等[24]利用2D激光雷达开发了坑洞探测系统和方法。Caltagiro等[25]开发了一种使用CNN的点云顶视图图像道路检测方法。然而据文献[26-27]中的资料显示即使最安全的激光雷达,长时间的照射也会对人眼造成损害(如白内障和视网膜烧伤)。

综上所述,大多数道路识别算法采用的基于传统机器学习,不可避免需人工提取图像特征作为输入,该过程具有一定随机性,且提取过程较为复杂。针对上述问题,本研究提出一种基于改进AlexNet模型的路面状态识别。首先,针对ALexNet网络显存的缺点将ReLU激活函数改进为LeakReLU,添加正则化层BN;此外将改进的ALexNet网络进行迁移学习,将ImageNet预训练的浅层网络权重进行冻结,替换原有的3层全连接层为两个全连接层并在路面图像数据集进行训练,提高网络训练效率和识别准确率。

1 路面图像数据集 1.1 路面图像数据集收集

针对路面图像数据集资源少、质量参差不齐且无法有效统一用于评估多种路面识别方法的优劣性等问题,本研究按照典型路面状况对主流的KITTI数据集[28]、CaRINA数据集[29]和RTK数据集[30]等进行选取和整理得到路面图像数据集。卡尔斯鲁厄理工学院的KITTI数据集是一个发达国家路面状况的数据集,其数据收集于德国的农村、城市和高速公路。虽然不包含太多的路面状况变化也没有湿滑和雨雪路面,优势在于有足够的光照变化路面数据集样本,是目前文献中使用和引用最多的数据集之一。CaRINA数据集是由移动机器人实验室(ICMC/USP-S)在巴西圣保罗拍摄收集,侧重于发展中国家的路面状况,数据集呈现了更多的道路表面变化,且有其他类型的路面和少数未铺路面的图像样本,但很少有雨雪、潮湿路面样本。上述两个数据集均采用了高质量摄像机对真实路面场景进行拍摄,其中KITTI使用了4个点灰色Flea2相机,一对用于灰度捕捉,另一对用于彩色捕捉;而CaRINA采用了Bumblebee XB3进行道路场景图像采集。RTK数据集是在巴西圣卡塔林纳州邻近城市拍摄,所有图像均在白天良好天气条件下采集。同一种路面类型也均有差异,例如:颜色较浅的旧沥青和颜色较深的新沥青。RTK数据集则使用一款普通HP Webcam HD-4110相机。

还有其他一些关注驾驶员辅助或自主导航系统的数据集,例如英国剑桥的Cam-Vid数据集、德国城市景观数据集,但上述数据集几乎无路面状况变化的样本,也未见湿滑、泥泞路面样本。结合几种常见路面类型要求,本研究考虑了数据集内同一场景其图像的不同清晰度和光照强度等影响因素,对KITTI数据集、CaRINA数据集和RTK数据集进行选取和整理,挑选了6种常见路面类型共6 000张原始路面图像,分别为Asphalt(干燥沥青路面)、Mud(淤泥路面)、Unpaved(未铺地路面)、Paved(铺地路面)、Snow(雪路面)和WetAsphalt(潮湿沥青路面)各1 000张,部分路面图像如图 1所示。

图 1 6种路面图像典型样本 Fig. 1 Typical samples of 6 kinds road images

1.2 路面图像ROI选取

通过识别车辆当前行驶的路面图像来实现路面状况识别,而样本图像内容较为丰富,除了底部的路面图像还有大部分背景和非道路图像,因此需对样本图像进行感兴趣区域划分,保留与路面类型识别最相关的部分,即图像的下半部分。通过硬编码方式,对上述3个数据集设置相同的感兴趣区域(与图像分辨率成比例),从图像底部剪裁,避免了大部分背景和非道路图像。

1.3 路面图像样本的数据增强

网络模型训练过程中通常会出现由于训练数据量不足导致过拟合的情况,因此本研究通过更改训练数据不改变数据标签的方式进行数据增强减轻或防止过拟合,在图像预处理阶段采用路面图像光照强度变换操作和图像空间几何变换操作进行数据扩充。

1.3.1 路面图像光照强度变换操作

路面状况识别准确度受光照强度影响较大,然而实际路面图像采集过程中,不同天气状况采集的路面图像有限且随机。为了模拟不同天气状况下,光照强度不同对路面的影响,本研究采用伽马变换[31]通过调整参数γ改变图像的整体亮度、强度以达到模拟光照变化。伽马函数如式(1)所示:

(1)

式中,Iin为输入图像亮度强度;Iout为输出图像亮度强度;γ为调整伽马函数形状参数。

图 2可知,当γ>1,输出的图像亮度强度小于输入图像;当γ < 1,输出图像亮度强度大于输入图像。

图 2 伽马函数曲线 Fig. 2 Gamma function curves

1.3.2 路面图像空间几何变换操作

通过对路面图像进行空间几何变换操作来增强数据集,比如对原始图像进行旋转、平移、水平翻转、缩放和剪切变换等。

(1) 旋转:将原图像绕原点顺时针旋转一定角度达到数据扩充。

(2) 缩放:路面图像各像素值除以255,即将其进行归一化处理至(0, 1)区间,并加上偏置值防止像素矩阵存在0值影响后续计算。

(3) 平移:对路面图像随机进行水平方向或垂直方向平移。

(4) 翻转:选取数据集内部分图像进行翻转变换(图 3),增加数据多样性达到数据增强。

图 3 路面图像几何变换示例 Fig. 3 Examples of geometric transformation of pavement image

2 基于改进ALexNet模型的路面状态识别方法研究

近年来人工智能飞速发展催生了深度学习[32]的发展。常见的深度学习网络包括卷积神经网络、自动编码器[33]和深度信念网络[34],其中CNN在图像识别中又起着关键作用。如图 4所示,而传统的道路类型识别方法存在提取过程复杂、适应性弱、光照鲁棒性差、识别精度低、实际应用困难等局限性,因此本研究将深度学习理论与路面状况识别相结合,通过CNN对路面特征的自学习和训练,建立道路图像识别模型,识别车辆当前行驶路面的类型。

图 4 传统机器学习和深度学习的识别过程比较 Fig. 4 Comparison of recognition process between traditional machine learning and deep learning

2.1 ALexNet网络模型

典型的CNN模型通常包括ALexNet,GoogLeNet[35],VGG-16[36]。其中GoogLeNet和VGG-16分别有22层、16层。网络的多层结构大大提高了网络的性能和泛化能力,理论上模型层数越深,分类效果越好,但层次越多随之参数越多,训练时间也越长。而ALexNet采用多层结构主要由5个卷积层、3个池化层和3个全连接层组成,其网络结构和参数配置如图 5表 1所示。

图 5 ALexNet结构示意图 Fig. 5 Schematic diagram of ALxNet structure

表 1 ALexNet参数配置 Tab. 1 ALexNet parameter configuration
ALexNet结构参数名称 参数 Stride 卷积核个数
Conv 1 11×11×3 4 96
Pool 1 1×3×3×1 2
Conv 2 5×5 ×48 1 256
Pool 2 1×3×3×1 2
Conv3 3×3 ×256 1 384
Conv4 3×64 ×384 1 384
Conv5 3×3 ×384 1 256
Pool5 1×3×3×1 2
Fc6 4 096
ReLU6 ReLU
Dropout 0.5
Fc7 4 096
ReLU7 ReLU
Dropout 0.5
Fc8 1 000
SoftMax softMax

ALexNet具有良好的泛化性能适用于路面状况识别,这主要归功于以下几点:

(1) 训练过程中,网络本身采用随机忽略部分神经元的方法避免了模型过拟合。

(2) 训练前对样本的数据增强,解决图像较少的问题。

(3) 采用ReLU[37]为网络激活函数,改善了网络的非线性,解决了梯度弥散问题。

2.2 改进的ALexNet网络框架

(1) 由上小节可知,ALexNet采用ReLU作为激活函数改善了网络非线性,解决了梯度弥散问题,但由图 6可知ReLU函数将所有负值设为0,函数梯度为0会造成网络无法执行反向传播的神经元死亡等问题从而导致训练丢失。本研究引入Leaky ReLU[38](图 6)能很好解决ReLU输出为0的问题。

图 6 激活函数曲线 Fig. 6 Activation function curves

(2) ALexNet网络由多层网络连接而成。反向训练过程中每一层的参数更新会导致上层的输入数据分布变化,这使得深层不断重新适应底层的参数更新,而越深层的参数输入分布变化越剧烈,这种数据分布称为“internal covariate shift”。通常为了达到较好的训练效果,往往设置较低的学习率,还要避免饱和非线性。为了解决此问题,本研究引入正则化层Batch Normalization(BN)[39],将BN代替ALexNet中原有LRN。BN数据归一化算法如式(2)所示:

(2)

式中,x(k)为输入的神经元;E [x(k)]为训练数据神经元x(k)的平均值;为训练数据神经元x(k)激活度的一个标准差。如果某层只用这个归一化公式,则会降低其表达能力,进而影响网络学习特征。为此对每一个神经元引入了可学习参数γβ,如式(3)所示:

(3)
2.3 RSRM迁移学习

首先将网络模型在ImageNet数据库(至少100万幅图像)上进行预训练;其次训练后得到浅层网络具有较强的学习特征的能力,尤其是对图像的曲线、边缘和轮廓等特征;最后采用微调迁移学习[40]将其预训练的参数保存至PCRM中。此方法大大提高网络训练的效率、准确率,减少训练时间。

PCRM由卷积层、池化层、全连接层和SoftMax分类层组成。分析实际路面图像特征,重点选取6种典型路面类型,PCRM中也采用6-label SoftMax代替原有分类器。原3个全连接层由两个全连接层替换,且节点数分别为4 096,9。

3 试验结果与分析 3.1 试验环境设置

PCRM采用交叉熵损失函数和随机梯度下降法的优化方法。路面图像数据集按照7∶3比例分为训练集和验证集。表 2为模型训练参数设置。

表 2 模型训练的参数设置 Tab. 2 Parameter setting for model training
验证频率 最小批量数 迭代次数 学习率
32 iteration 128 images 30 0.000 1

3.2 试验结果对比与分析 3.2.1 试验结果分析

图 7~8对比了ALexNet网络和改进ALexNet网络(PCRM)两种模型训练结果。

图 7 改进的ALexNet网络训练结果 Fig. 7 Training result of improved ALexNet network

图 8 改进的ALexNet网络训练结果 Fig. 8 Training result of improved ALexNet network

对比图 7(a)8(a)可知,PCRM模型迭代200次时,验证数据集准确度已达到88%以上,验证数据集的Loss损失值约为0.33,而ALexNet网络模型的验证数据集准确度只达到60%,验证数据集的Loss损失值约为0.6,在验证数据集的准确度PCRM模型比ALexNet提高了28%,验证数据集Loss损失值方面减少了2倍。10个Epoch迭代到800次时,PCRM网络模型已开始趋于收敛,验证数据集准确率在91%左右,验证数据集的Loss损失值为0.24,而ALexNet网络模型的仍未开始进行收敛,验证数据集准确率在82%,验证数据集的Loss损失值为0.36。20个Epoch即1 200次迭代后,PCRM网络模型已完全收敛且验证数据集准确率达到93%,而ALexNet网络模型收敛趋势不明显,验证数据集准确率仍然在90%浮动。1 600次迭代之后,PCRM网络模型验证集数据集准确率的波动更小,收敛后波动不超过1%,而ALexNet验证集准确率的波动在3%以内,表明PCRM网络模型比ALexNet网络模型更可靠、稳定。经过30次Epoch训练之后,PCRM网络模型的最终的验证准确率为99.5%,验证数据集的Loss损失值为0.056 3,而ALexNet验证准确率为96.6%,验证数据集的Loss损失值为0.007 6。在相同训练配置下,PCRM网络模型比ALexNet验证集准确率提升了2.9%,验证数据集的Loss损失值降低了0.555 4。

图 9(a)~(b)分别为ALexNet模型和改进的ALexNet(PCRM)识别的混淆矩阵结果。图 9最右列表示预测每种路面正确和错误的百分比,也称精确度;底部行显示每类所有示例正确和错误的百分比,也称召回率;图右下角显示总体精度。由图 9(b)可知PCRM在Asphalt,Mud,Snow和WetAsphalt这4种路面样本数据集的识别精确度达到100%,而ALexNet网络只有Mud和WetAsphalt两种路面识别精确度达到100%,其中Unpaved路面识别精确度只有92.6%,识别精确度明显低于PCRM(99.3%)。

图 9 模型混淆矩阵 Fig. 9 Model confusion matrixes

分析判断错误样本数量级可知,其中Paved,Unpaved和Asphalt这3种样本数据集最容易相互误判,其中有4张Asphalt路面样本被误识别为Paved样本数据集;2张Asphalt路面样本被误识别为Unpaved;3张Unpaved路面样本被误识别为Paved路面样本。分析上述3种样本最容易误判的原因有二:(1)同一种路面会有Unpaved和Paved路面图像交叉情况,这在训练与识别时会导致误判。(2)由于部分Asphalt,Paved和Paved的路面样本颜色和纹理非常接近,卷积核在提取路面图像样本特征时,样本特征提取相似导致误判。

3.2.2 与其他分类算法对比分析结果

颜色和纹理是道路图像的主要特征。支持向量机(SVM)分类模型需人工提取道路图像特征,在HSV,RGB和YCM这3个颜色空间中,道路图像有9个颜色分量,分别为H,S,V,R,G,B,Y,C和M,利用灰度共生矩阵提取了路面图像的对比度、自相关、能量和熵4种纹理信息。BP神经网络则选取5层,每层节点数为100,采用随机梯度下降优化算法。由图 10表 3可知,将本研究提出的PCRM与ALexNet模型、SVM和BP等在训练精确率、测试精确率、单张样本识别时间等方面进行对比分析。

图 10 不同识别模型的试验结果 Fig. 10 Test result of different recognition models

表 3 不同模型结果对比 Tab. 3 Comparison of results obtained by different models
模型 SVM BP ALexNet PCRM
训练精确率/% 90.36 93.84 97.65 100
测试精确率/% 88.09 92.80 96.60 99.90
试验时间/min 102 50 8 8
单张样本识别时间/s 0.19 0.18 0.18 0.17

表 3可知,SVM,BP,ALexNet和PCRM的训练精确率分别为90.36%,93.84%,97.65%和100%。PCRM和ALexNet的准确率均在97%以上。PCRM识别准确率分别比ALexNet,BP和SVM高3.3%,7.1%和11.81%。4个模型对单张测试图像识别的平均时间几乎相同。传统机器学习方法(SVM,BP)需人工提取道路图像特征不适合表达光照强度变化且对较大数据集特征提取耗费时间较长,只适合小数据集;BP网络神经元数量多,网络层数不能过大容易出现过拟合,且训练过程耗费时间较多,不适合识别大样本数据集。而卷积网络通过权值共享和卷积操作节省训练时间,这体现了深度学习方法的优越性,尤其是PCRM不仅能在较短训练时间内实现快速、高精度的路面类型识别,还能满足实际路面状况的感知要求。

4 结论

本研究提出了一种基于改进ALexNet模型(PCRM)的路面识别方法。首先,针对ALexNet网络显存的缺点将ReLU激活函数改为LeakReLU,添加正则化层BN;其次将改进的ALexNet网络进行迁移学习,将ImageNet预训练的浅层网络权重进行冻结,替换原有3层全连接层为两个全连接层并在路面图像数据集进行训练;最后,在ALexNet网络中用6标签SoftMax代替原分类器,着重从适应性、预测输出、误差性能等方面对比了传统机器学习方法(BP,SVM)和PCRM。结果表明PCRM识别精确度为99.90%,分别高于ALexNet,BP和SVM 3.3%,7.1%和11.81%。综上所述,PCRM模型不仅比传统机器学习方法具有更高的识别精度、鲁棒性和更短的识别时间,且能够满足多种实际路况路面图像的感知要求。该研究方法不仅适用于道路识别,而且适用于人-车-路协同感知车辆环境。

参考文献
[1]
孙鑫. 基于突变理论的高速公路交通安全风险耦合研究[D]. 北京: 北京交通大学, 2015.
SUN Xin. Research on Highway Traffic Safety Risk Coupling Based on Catastrophe Theory[D]. Beijing: Beijing Jiaotong University, Beijing, 2015.
[2]
RATEKE T, VON WANGENHEIM A. Road Surface Detection and Differentiation Considering Surface Damages[J]. Autonomous Robots, 2021, 45: 299-312. DOI:10.1007/s10514-020-09964-3
[3]
WIESEL T N, HUBEL D H. Effects of Visual Deprivation on Morphology and Physiology of Cells in the Cat's Lateral Geniculate Body[J]. Journal of Neurophysiology, 1963, 26(6): 978-993. DOI:10.1152/jn.1963.26.6.978
[4]
LECUN Y, BOTTOU L, BENGIO Y, et al. Gradient-based Learning Applied to Document Recognition[J]. Proceedings of the IEEE, 1998, 86(11): 2278-2324. DOI:10.1109/5.726791
[5]
GIRSHICK R, DONAHUE J, DARRELL T, et al. Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation[C]//Proceedings of the 2014 IEEE Conference on Computer Vision and Pattern Recognition. Columbus: IEEE, 2014: 580-587.
[6]
LIU W, ANGUELOV D, ERHAN D, et al. SSD: Single Shot Multibox Detector[C]//European Conference on Computer Vision. Cham: Springer, 2016: 21-37.
[7]
REDMON J, DIVVALA S, GIRSHICK R, et al. You Only Look Once: Unified, Real-time Object Detection[C]// Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas: IEEE, 2016: 779-788.
[8]
杜兰, 刘彬, 王燕, 等. 基于卷积神经网络的SAR图像目标检测算法[J]. 电子与信息学报, 2016, 38(12): 3018-3025.
DU Lan, LIU Bin, WANG Yan, et al. Target Detection Method Based on Convolutional Neural Network for SAR Image[J]. Journal of Electronics & Information Technology, 2016, 38(12): 3018-3025.
[9]
张慧娜, 李裕梅, 傅莺莺. 基于Haar-CNN模型的自然场景图像分类的研究[J]. 四川师范大学学报(自然科学版), 2017, 40(1): 119-126.
ZHANG Hui-na, LI Yu-mei, FU Ying-ying. Research on Natural Scene Image Classification Based on Haar-CNN Model[J]. Journal of Sichuan Normal University (Natural Science Edition), 2017, 40(1): 119-126.
[10]
CHEN Y. Image Analysis Applied to Black Ice Detection[C]//Applications of Artificial Intelligence IX. Orlando: SPIE, 1991.
[11]
BEKHTI M A, KOBAYASHI Y. Prediction of Vibrations as A Measure of Terrain Traversability in Outdoor Structured and Natural Environments[M]//Image and Video Technology. Cham: Springer, 2015: 282-294.
[12]
WARD C C, IAGNEMMA K. Speed-independent Vibration-based Terrain Classification for Passenger Vehicles[J]. Vehicle System Dynamics, 2009, 47(9): 1095-1113. DOI:10.1080/00423110802450193
[13]
ALONSO J, LÓPEZ J M, PAVÓN I, et al. On-board Wet Road Surface Identification Using Tyre/Road Noise and Support Vector Machines[J]. Applied Acoustics, 2014, 76: 407-415. DOI:10.1016/j.apacoust.2013.09.011
[14]
NEUPANE S R, GHARAIBEH N G. A Heuristics-based Method for Obtaining Road Surface Type Information from Mobile Lidar for Use in Network-level Infrastructure Management[J]. Measurement, 2019, 131: 664-670. DOI:10.1016/j.measurement.2018.09.015
[15]
JONSSON P, CASSELGREN J, THÖRNBERG B. Road Surface Status Classification Using Spectral Analysis of NIR Camera Images[J]. IEEE Sensors Journal, 2014, 15(3): 1641-1656.
[16]
BYSTROV A, HOARE E, TRAN T Y, et al. Road Surface Classification Using Automotive Ultrasonic Sensor[J]. Procedia Engineering, 2016, 168: 19-22. DOI:10.1016/j.proeng.2016.11.119
[17]
DU Z, YUAN J, XIAO F, et al. Application of Image Technology on Pavement Distress Detection: A Review[J]. Measurement, 2021, 184: 109900. DOI:10.1016/j.measurement.2021.109900
[18]
万剑, 赵恺, 王维锋. 基于高维特征和RBF神经网络的湿滑道路图像判别方法[J]. 交通信息与安全, 2013, 31(2): 32-35.
WAN Jian, ZHAO Kai, WANG Wei-feng. Classification of Slippery Road Images Based on High-dimensional Features and RBF Neural Network[J]. Journal of Transport Information and Safety, 2013, 31(2): 32-35.
[19]
ZHAO J, WU H, CHEN L. Road Surface State Recognition Based on SVM Optimization and Image Segmentation Processing[J]. Journal of Advanced Transportation, 2017, 2017: 6458495.
[20]
CASSELGREN J, SJÖDAHL M, LEBLANC J. Angular Spectral Response from Covered Asphalt[J]. Applied Optics, 2007, 46(20): 4277-4288. DOI:10.1364/AO.46.004277
[21]
LINTON M A, FU L. Connected Vehicle Solution for Winter Road Surface Condition Monitoring[J]. Transportation Research Record, 2016, 2551: 62-72. DOI:10.3141/2551-08
[22]
JOKELA M, KUTILA M, LE L. Road Condition Monitoring System Based on a Stereo Camera[C]//2009 IEEE 5th International Conference on Intelligent Computer Communication and Processing. Cluj-Napoca: IEEE, 2009: 423-428.
[23]
KANG B, CHOI S. Pothole Detection System Using 2D LiDAR and Camera[C]//2017 Ninth International Conference on Ubiquitous and Future Networks (ICUFN). New York: IEEE, 2017: 744-746.
[24]
YU X, SALARI E. Pavement Pothole Detection and Severity Measurement Using Laser Imaging[C]//2011 IEEE International Conference on Electro/Information Technology. Piscataway: IEEE, 2011: 1-5.
[25]
CALTAGIRONE L, SCHEIDEGGER S, SVENSSON L, et al. Fast LIDAR-based Road Detection Using Fully Convolutional Neural Networks[C]//2017 IEEE Intelligent Vehicles Symposium. Los Angeles: IEEE, 2017: 1019-1024.
[26]
DEY D, HABIBOVIC A, LÖCKEN A, et al. Taming the eHMI Jungle: A Classification Taxonomy to Guide, Compare, and Assess the Design Principles of Automated Vehicles' External Human-machine Interfaces[J]. Transportation Research Interdisciplinary Perspectives, 2020, 7: 100174. DOI:10.1016/j.trip.2020.100174
[27]
RAPP J, TACHELLA J, ALTMANN Y, et al. Advances in Single-photon Lidar for Autonomous Vehicles: Working Principles, Challenges, and Recent Advances[J]. IEEE Signal Processing Magazine, 2020, 37(4): 62-71. DOI:10.1109/MSP.2020.2983772
[28]
GEIGER A, LENZ P, STILLER C, et al. Vision Meets Robotics: The Kitti Dataset[J]. International Journal of Robotics Research, 2013, 32(11): 1231-1237. DOI:10.1177/0278364913491297
[29]
SHINZATO P Y, DOS SANTOS T C, ROSERO L A, et al. Carina Dataset: An Emerging-country Urban Scenario Benchmark for Road Detection Systems[C]//2016 IEEE 19th International Conference on Intelligent Transportation Systems (ITSC). Rio de Janeiro: IEEE, 2016: 41-46.
[30]
RATEKE T, JUSTEN K A, VON WANGENHEIM A. Road Surface Classification with Images Captured from Low-cost Camera-road Traversing Knowledge (RTK) Dataset[J]. Revista de Informática Teórica e Aplicada, 2019, 26(3): 50-64. DOI:10.22456/2175-2745.91522
[31]
王晓华, 赵志雄. 结合伽马变换和小波变换的PCA人脸识别算法[J]. 计算机工程与应用, 2016, 52(5): 190-193.
WANG Xiao-hua, ZHAO Zhi-xiong. PCA Face Recognition Algorithm Combined with Gamma Transform and Wavelet Transform[J]. Computer Engineering and Applications, 2016, 52(5): 190-193.
[32]
LECUN Y, BENGIO Y, HINTON G. Deep Learning[J]. Nature, 2015, 521: 436-444.
[33]
AYINDE B O, ZURADA J M. Deep Learning of Constrained Autoencoders for Enhanced Understanding of Data[J]. IEEE Transactions on Neural Networks and Learning Systems, 2018, 29(9): 3969-3979.
[34]
MOHAMED A, DAHL G E, HINTON G. Acoustic Modeling Using Deep Belief Networks[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2012, 20(1): 14-22.
[35]
SZEGEDY C, LIU W, JIA Y, et al. Going Deeper with Convolutions[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Boston: IEEE, 2015: 1-9.
[36]
SIMONYAN K, ZISSERMAN A. Very Deep Convolutional Networks for Large-scale Image Recognition[R]. [S. l. ]: arXiv Preprint, 2015.
[37]
JIA S J, WANG P, JIA P Y, et al. Research on Data Augmentation for Image Classification Based on Convolution Neural Networks[C]//2017 Chinese Automation Congress (CAC). Jinan: IEEE, 2017: 4165-4170.
[38]
RADFORD A, METZ L, CHINTALA S. Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks[R]. [S. l. ]: arXiv Preprint, 2015.
[39]
IOFFE S, SZEGEDY C. Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift[C]// Proceedings of 32nd International Conference on Machine Learning, Lille: JMLR, 2015: 448-456.
[40]
PAN S J, YANG Q. A Survey on Transfer Learning[J]. IEEE Transactions on Knowledge and Data Engineering, 2009, 22(10): 1345-1359.