公路交通科技  2022, Vol. 39 Issue (10): 1-8, 58

扩展功能

文章信息

章天杰, 王洋洋, 韩海航, 罗雪
ZHANG Tian-jie, WANG Yang-yang, HAN Hai-hang, LUO Xue
基于改进两步式卷积神经网络的沥青路面裂缝识别方法
A Method for Recognizing Asphalt Pavement Cracks Based on Modified Two-step Convolutional Neural Network
公路交通科技, 2022, 39(10): 1-8
Journal of Highway and Transportation Research and Denelopment, 2022, 39(10): 1-8
10.3969/j.issn.1002-0268.2022.10.001

文章历史

收稿日期: 2020-06-07
基于改进两步式卷积神经网络的沥青路面裂缝识别方法
章天杰1,2 , 王洋洋1,2,3 , 韩海航1 , 罗雪3     
1. 浙江省交通运输科学研究院, 浙江 杭州 310012;
2. 浙江省道桥检测与养护技术研究重点试验室, 浙江 杭州 310012;
3. 浙江大学, 浙江 杭州 310012
摘要: 为实现沥青路面裂缝长度和面积等几何信息的智能提取, 提出了一种基于改进两步式卷积神经网络的沥青路面裂缝几何信息提取法。在完成数据的采集后, 第1步主要通过人工筛选出失真图像、无病害图像和可能存在病害图像各600张, 训练基于卷积注意力模块改进的图像分类算法ResNet50, 以此作为本模型的清洗算法, 完成对410 000张原始路面图像的清洗工作, 筛除其中的失真图像和无病害图像, 构建裂缝病害图像数据集; 第2步基于卷积注意力模块对图像语义分割算法U-Net进行改进, 使用上一步筛选的数据进行训练与测试, 训练集与测试集的样本比例为10∶1, 以此实现裂缝图像的分割, 并对裂缝的长度和面积进行提取。试验结果表明, 本研究提出的改进ResNet50算法对于总体样本清洗结果的精确率、召回率和F1值均已超过95%, 其中F1值已经达到了96.8%;两步式沥青路面裂缝几何信息提取法的均交并比为0.496 7, 其中横向裂缝、纵向裂缝、龟裂、块状裂缝的交并比分别为0.495 1, 0.546 7, 0.608 5和0.336 6;在裂缝长度信息提取上, 横向裂缝的误差为12.18%, 纵向裂缝的误差仅为3.88%;在裂缝面积的信息提取中, 横向裂缝、纵向裂缝、龟裂、块状裂缝的误差分别为0.58%, 12.14%, 12.27%, 11.44%。
关键词: 道路工程     裂缝识别     卷积神经网络     沥青路面     卷积注意力模块     ResNet50     U-Net    
A Method for Recognizing Asphalt Pavement Cracks Based on Modified Two-step Convolutional Neural Network
ZHANG Tian-jie1,2, WANG Yang-yang1,2,3, HAN Hai-hang1, LUO Xue3    
1. Zhejiang Scientific Research Institute of Transport, Hangzhou Zhejiang 310012, China;
2. Key Laboratory of Road and Bridge Inspection and Maintenance Technology Research of Zhejiang Province, Hangzhou Zhejiang 310012, China;
3. Zhejiang University, Hangzhou Zhejiang 310012, China
Abstract: A modified two-step convolutional neural network (CNN) method was investigated to analyze pavement crack length and area in the study. Firstly, an image classification algorithm called ResNet50 was modified by a Convolutional Block Attention Module (CBAM) and then used to eliminate distortion and non-defect images from 410 000 raw samples. In the second step, an image segmentation algorithm called U-Net, also modified by CBAM, was used to segment cracks from non-crack regions. Length and area of pavement cracks were extracted. Results show that precision, recall, and F1-score of the modified ResNet50 exceeds 95%, and F1-score reaches 96.8%; Mean Intersection over Union (MIoU) of the two-step method is 0.496 7; Intersection over Union (IoU) of transverse crack, longitudinal crack, craze crack, and block crack are 0.495 1, 0.546 7, 0.608 5, 0.336 6 separately; prediction error of length from transverse crack, and longitudinal crack is 12.18% and 3.88% separately. Prediction error of area from transverse crack, longitudinal crack, craze crack, and block crack are 0.58%, 12.14%, 12.27%, 11.44% separately.
Key words: road engineering     crack recognition     convolutional neural network     asphalt pavement     convolutional attention module     ResNet50     U-Net    
0 引言

随着公路使用年限的增长,沥青路面裂缝已经成为公路的最主要病害之一,严重影响着路面的使用寿命,同时增加了沥青路面养护的难度[1]。这需要各地市公路局定期检测裂缝并分析成因,及时开展养护工作[2]。但是传统的沥青路面裂缝检测方法效率低下,基于智能算法进行路面图像的裂缝识别是大势所趋。

机器学习被广泛地应用于沥青路面裂缝识别领域,其核心在于通过对沥青路面裂缝特征的学习,提炼出特征,从而预测未知数据。支持向量机,K-Means算法等,已被广泛应用于沥青路面裂缝图像的分类识别中[3-4]。如琚晓辉等[5]提出的SVM-Adaboost裂缝图像分类算法,其通过支持向量机分类器对内部参数进行动态优化,以此实现沥青道路裂缝的分类检测。Ai等[6]基于多邻域信息的裂缝像素级分割,其算法基于精确率和召回率计算得到的F1值能达到0.8。Wissam等[7]提出的基于改进最小路径法的裂缝图像分割算法,其准确率已经能达到75%左右。张采芳等[8]提出的基于几何特征分析的裂缝检测方法,最终的裂缝检测准确率能达到90%。

但是机器学习方法存在需要人工提取图像特征的缺点,以卷积神经网络为代表的深度学习方法,因其能够对图像进行像素级学习,开始逐步被应用于道路裂缝识别中[9-10]。大量的工作集中于裂缝的识别分类领域,如孙朝云等[11]通过VGG16和Faster R-CNN结合的模型对路面灌封进行目标检测,模型精度达到了90%。Seongdeok等[12]将基于迁移学习的ResNet-152用于通过相机采集的图像进行裂缝识别,最终模型的精确率和召回率分别为77.68%和71.98%。Dung等[13]设计了一种基于全卷积神经网络FCN的裂缝识别算法,检测结果的平均精确率达到90%。

相比于沥青路面裂缝识别分类,如何提取出裂缝的长度、面积等参数成为道路裂缝识别领域的一个重点和难点。其结果能有效地用于公路性能评价,最终为公路养护提供有效参考。虽然在裂缝识别分类方面已有大量研究,但在裂缝分割及参数自动提取方面的工作并不多。Liu等[14]通过将YOLO v3和U-Net结合的方式对路面裂缝进行分割,达到了较高的准确率,但是其并没有使用U-Net对YOLO v3检测出的区域进行分割,实际上并没有评价整个模型的性能,也没有基于裂缝分割结果提取相关参数。

鉴于此,本研究提出了一种两步式沥青路面裂缝几何信息提取法。首先,采用了卷积注意力模块进行改进的残差神经网络(Residual Neural Network,Resnet)对大量原始沥青路面图像进行数据清洗,随后再次使用卷积注意力模块对图像语义分割网络U-Net进行改进,对第1步中筛选出的图像进行裂缝语义分割和裂缝几何信息提取,最后评价了该两步式方法的结果。

1 方法与原理

本研究提出的两步式沥青路面裂缝几何信息提取法的主要目的是从沥青路面图像中抽取出包含裂缝的像素,以此实现裂缝的分割和裂缝长度、面积等信息的提取,具体流程如图 1所示。首先人工筛选出1 800张用于路面图像分类算法训练的数据,然后训练基于卷积注意力模块改进的ResNet50模型,并以此算法对原始图像集开展清洗工作,通过清洗、标注、图像数据增广等方式准备好用于第2步模型的训练集和测试集后,使用基于卷积注意力模块改进U-Net的图像语义分割模型进行训练,最后实现裂缝的语义分割和裂缝长度、面积信息的提取。该方法第1步的清洗结果主要为第2步裂缝几何信息的提取服务,可有效降低整个裂缝信息提取流程的工作量。

图 1 两步式沥青路面裂缝信息提取法流程图 Fig. 1 Flowchart of 2-step asphalt pavement crack extraction method

数据处理、模型训练和评估通过深度学习开源框架Tensorflow实现,模型所采用的计算机环境主要为Linux和windows系统,卷积神经网络的所用软件为python 3.6。

1.1 数据采集

本研究所采用的路面图像数据主要来源于浙江省部分沥青路面的巡检结果,其中包括8条国道,13条省道,30条县道,48条乡道和215条村道。全部由浙江省交通运输科学研究院的道路综合检测车Pathrunner采集获得。

原始图像直接从综合检测车配套的软件中导出,尺寸为272×272像素,可直接用于本模型的输入。

1.2 卷积注意力模块介绍

卷积注意力模块模块由Woo等[15]在2018年的ECCV会议中最先提出。CBAM模块作为一个轻量级模块,可以方便地融入到其他神经网络模型中,以提升模型性能,其在遥感图像、建筑物破损等背景信息多,目标信息占比少的案例中都得到了较好的应用[16-17]

本研究算法中的CBAM模块作用的原理如下:首先,进行通道注意力提取。将沥青路面裂缝输入的特征图通过两种不同的池化操作得到2个一维矢量,实现在空间维度上的压缩;并将2个一维矢量转发至1个多层感知网络,进行通道重要性分析并得到各通道层的权重矢量;随后利用权重矢量对沥青路面裂缝输入的特征图再进行1次加权,完成在通道域上对沥青路面裂缝特征的加强。其次,需要进行空间注意力的提取。将沥青路面裂缝特征沿着通道轴进行两种池化操作得到2个叠加的二维平面向量,以此实现在通道维度上的压缩。最后,将这两个提取的信息通过卷积网络进行分析得到相应权重,利用此权重向量对裂缝特征进行再一次加权,以此提高对沥青路面裂缝特征的关注程度。

1.3 性能评价指标

对于沥青道路路面裂缝图像进行分类识别,其算法的效果一般采用F1值(F1-score)进行评价。F1值是对算法精确率(Precision)和召回率(Recall)的优化调和,能够保证算法在精确率和召回率上都有一定的准度。其中精确率、召回率和F1值的公式如下所示:

(1)
(2)
(3)

式中,TP为将沥青路面裂缝正确预测为裂缝的数量;TN为将正常路面正确预测为正常的数量;FP为将正常沥青路面错误预测为裂缝的数量;FN为将沥青路面裂缝错误预测为正常路面的数量。

对于裂缝图像语义分割模型的评价,本研究采用交并比(Intersection over Union,IoU)、均交并比(Mean Intersection over Union,MIoU)等方式评价。IoU的计算示意图如图 2所示。

图 2 IoU计算示意图 Fig. 2 Schematic diagram of calculation by IoU

图 2可知,IoU是2个区域重叠的部分除以2个区域的集合部分得出的结果,其是图像语义分割算法中能判断算法模型好坏的重要指标之一。MIoU可通过计算所有分类的IoU平均值得到。

2 路面图像分类算法 2.1 图像集准备

本次试验共计采集的路面图像样本为41万张。分析Pathrunner道路综合检测车检测得到的部分沥青路面图像,发现沥青路面样本可分为无病害样本、失真样本和可能存在病害样本3种类别,如图 3所示。

图 3 综合检测车采集的沥青路面图像 Fig. 3 Asphalt pavement images collected by comprehensive detection vehicle

图 3可以发现,其中无病害样本(除地标线外无任何干扰物)占70%以上,失真样本占约10%,而可能存在病害的样本(包含真实裂缝,也包含伸缩缝、污渍、光照不均导致的干扰图像等)仅占全部的20%左右。为了提高沥青路面裂缝病害的标注速度,同时也为了减小沥青路面样本的不均衡性,例如正常路面图片过多,需对沥青道路路面图像数据进行清洗工作,筛选掉正常沥青路面样本即无病害样本,同时对由于检测车自身原因导致的失真样本进行删除。

沥青路面裂缝图像数据的清洗工作采用了人工清洗与模型清洗相结合的方式进行。先由人工挑选出无病害样本、失真样本、可能存在病害样本各600张(共1 800张),其中每类525张作为训练样本,75张作为测试样本,以此作为清洗模型的输入。

2.2 模型训练

本次清洗模型采用何凯明[18]提出的残差神经网络ResNet50,其采用残差学习来解决深度神经网络退化的问题,具有层数更深、参数量更少、收敛更快和精度更高的优点。本研究所采用的ResNet50卷积神经网络中包含4个大的block,本研究采用的模型共有3+4+6+3=16个bottleneck,最后采用全连接操作完成沥青路面图像清洗任务,共计50个卷积层,模型总体结构如图 4所示。

图 4 Resnet50结构 Fig. 4 Structure of Resnet50

本模型输入尺寸设置为272×272×3;输出分类数为3,分别对应无病害样本、失真样本、可能存在病害样本3种情况;模型中的激活函数采用LeakRelu函数代替原模型中的Relu函数,确保激活函数非线性同时避免梯度弥散;网络损失函数采用softmax交叉熵;优化器采用Adam优化器并使用默认参数;在第1个卷积层与池化层间增加1个CBAM模块,增加该模块能使整个网络更注重目标物体的识别。本研究采用的清洗模型总共对所有的沥青路面图像进行训练共500次,模型的初始学习率预先设置为0.005,随后每20次训练进行1次学习率的衰减,衰减比率为0.9。

2.3 模型评价

对本研究清洗模型的结果进行评价,模型的精确率,召回率和F1值的结果可见图 5

图 5 路面图像清洗算法的评价结果 Fig. 5 Evaluation result of pavement images cleaning algorithm

图 5分别从无病害样本、失真样本、可能存在病害样本和总体4方面的精确率、召回率、F1值对路面图像清洗模型进行了评价。从图中可以看出,总体沥青路面病害图像的精确率、召回率和F1值都已经超过95%,其中F1值已经达到了96.8%,高于其他路面裂缝识别算法,如琚晓辉等[5]提出的SVM-Adaboost(91.86%)和张采芳等[8]提出的基于几何特征分析的裂缝检测方法(90%)等,说明本模型已具备良好的沥青路面裂缝图像清洗功能。

3 裂缝语义分割模型 3.1 图像集准备

通过数据清洗后可以从采集的41万张图像中筛选出约5 000张路面可能存在的病害样本。为进行准确的裂缝信息提取,需要将这5 000张路面图像中的非裂缝图像进行剔除,因此对该路面图像数据再次进行人工筛选,剔除伸缩缝、窨井盖、污渍等非裂缝病害,精选出1 650张沥青路面图像进行人工分割标注,标注的类别为沥青路面4大类型裂缝,即横向裂缝、纵向裂缝、龟裂、块状裂缝,以及正常非裂缝路面。进行一张路面的分割标注耗时约15 min,完成数据集内1 650张图像共耗时约400 h。标注完成后,将标注的力气路面图像数据集按照10∶1的比例分成训练集和测试集。训练样本和测试样本中各类别的数量分布如图 6所示。

图 6 裂缝语义分割模型数据集分布 Fig. 6 Distribution of dataset of crack segmentation model

针对图像样本存在着一图多病害、样本数量不均衡等问题,同时为了减少人为及客观原因对裂缝检测效果的影响,保障图像更利于模型训练,需要对裂缝图像样本进行数据增广。本研究采用的图像样本增广方式主要为传统图像增广方式,包括图像翻转、图像对比度修改、图像亮度修改、图像以一定角度旋转、图像裁剪与缩放等等,传统图像数据增广方法在沥青路面图像中的应用效果图如图 7所示。

图 7 数据增广方式 Fig. 7 Data augmentation modes

对沥青路面裂缝图像进行数据增广,一方面通过增加图片数据量,增加了路面裂缝图片数据集的丰富性;另一方面,由于通过数据扩充方式处理的图片和原图是不同的输入,因此可以减少模型过拟合现象的产生,增加模型泛化能力。

3.2 模型训练

图像语义分割算法能够在像素级别上进行分类,即对属于同一类(如横向裂缝)的像素会被归为一类,以此来对沥青路面中的各种裂缝进行分割提取。因此,本研究能够得到各类别裂缝病害数量、裂缝长度、面积、病害处于图中具体位置等计量信息,有助于为后续公路维养方案提供数据参考。

本研究采用U-Net实现路面图像分割。U-Net属于Encoder-Decoder结构,Encoder负责特征提取,Decoder负责解析特征并恢复沥青路面裂缝分割图到原始分辨率,其网络结构如图 8所示。Encoder部分包含有4个子模块,其中每个子模块包含2个卷积和1个下采样模块。本模型输入图像的分辨率是272×272的灰度图,在模型中,第1~4个模块的分辨率分别是272×272,136×136,68×68,34×34,4个模块通道数分别为64,128,256,512。相应的Decoder的4个模块分辨率分别为34×34,68×68,136×136,272×272,同时通道数分别为512,256,128,64。同时U-net对不同层进行了连接以提升模型的精确度。此外,本研究在U-Net模型的第1个池化层前增加了1个卷积注意力模块,以使整个模型更加注重于裂缝的识别。模型的损失函数采用Dice_ loss函数,用于解决裂缝在整个沥青路面图像中占比太小的问题。

(4)
图 8 U-Net结构 Fig. 8 Structure of U-Net

式中,X为目标像素,Y为预测像素。

本研究的改进U-net模型设置的最大训练次数为500轮,初始学习率的设置以及每轮训练后学习率的衰减比率与前述分类模型相同。当模型训练到没有办法通过降低模型学习率来减少模型训练的损失值时,停止本模型的训练或者直到模型达到最大训练次数。

3.3 模型评价

将训练好的模型对测试集中的路面图像进行分割,部分裂缝语义分割结果如图 9所示。

图 9 裂缝语义分割部分测试结果 Fig. 9 Partial test result of crack segmentation

图 9展示了裂缝语义分割模型的部分测试结果。从图中可以看出,模型的预测结果基本能同人工识别结果相对应。具体的重合程度需要通过IoU和MIoU 2个指标进行控制。因此对本模型的IoU和MIoU进行统计,统计结果列于见表 1

表 1 裂缝语义分割结果 Tab. 1 Resuls of crack segmentation
类型 横向裂缝 纵向裂缝 龟裂 块状裂缝
IoU 0.495 1 0.546 7 0.608 5 0.336 6
MIoU 0.496 7

表 1展示了横向裂缝、纵向裂缝、龟裂和块状裂缝的模型测试结果。从表中可以看出,龟裂的最终IoU达到了0.608 5,高于其他类型的IoU指标。块状裂缝的IoU仅为0.336 6,低于其他类型裂缝的IoU指标,这主要是因为块状裂缝在总体样本中占13%左右,所占比例较小,训练数据不足导致偏差较大。整个模型的平均交并比MIoU达到了0.5左右。同样针对裂缝图像进行分割任务的SPPNet[19]、Deeplabv3[20]等模型的试验结果如表 2所示。

表 2 裂缝语义分割模型对比 Tab. 2 Comparison of crack segmentation models
分割算法 MIoU
SPPNet 0.409 2
Deeplabv3 0.311 5
FCN-8s[21] 0.293 9
DilatedNet 0.323 1
PSPNet[22] 0.439 2
本模型 0.496 7

表 2展示了SPPNet,Deeplabv3,FCN-8s,DilatedNet,PSPNet以及本研究模型的MIoU值,本研究模型相较于其他模型高了近0.5~2个点,整体表现更好。

在裂缝信息提取方面,针对裂缝长度、面积信息提取结果的准确性,本研究进行了统计分析,统计结果见表 3

表 3 裂缝信息提取结果 Tab. 3 Result of crack information extraction
类型 横向裂缝 纵向裂缝 龟裂 块状裂缝
结果 预测 实际 预测 实际 预测 实际 预测 实际
裂缝总长/m 1 346.8 1 533.6 1 794.4 1 866.9
误差/% 12.18 3.88
裂缝面积/m2 216.34 215.09 289.49 258.16 375.67 334.62 207.51 186.2
误差/% 0.58 12.14 12.27 11.44
注:①裂缝总长:通过最小外接矩形的对角线长度计算得到。
②裂缝面积:通过像素面积换算得到。

表 3展示了对路面图像进行语义分割后的裂缝长度及面积信息提取结果。从表中可以看出,在裂缝长度信息提取上,横向裂缝的误差为12.18%,纵向裂缝的误差仅为3.88%。裂缝面积通过裂缝在路面图像中所占像素,并根据图像尺寸与实际尺寸比例尺换算得到,在裂缝面积的信息提取中,除了横向裂缝误差较小(仅为0.58%)外,其他裂缝的面积统计误差均在11%~13%之间。

4 结论

沥青路面裂缝自动识别与信息提取是实现路面养护的重要技术支撑与数据保障。本研究提出了一种基于深度学习的两步式沥青路面裂缝信息提取法用于实现沥青路面裂缝智能检测与信息自动提取。主要得到以下结论:

(1) 融合了基于CBAM改进的ResNet50和U-Net算法,构建了用于沥青路面裂缝几何信息提取的两步式方法。

(2) 本研究提出的基于改进ResNet50的图像分类算法对于总体样本清洗结果的精确率、召回率和F1值均已超过95%,其中F1值已经达到了96.8%。

(3) 本研究提出的两步式模型最终的MIoU达到了0.496 7,其中横向裂缝、纵向裂缝、龟裂的IoU分别为0.495 1,0.546 7,0.608 5,块状裂缝由于样本数量少的原因,其IoU值较低,仅为0.336 6。

(4) 在裂缝长度和面积提取中,纵向裂缝的长度预测误差为3.88%,横向裂缝的长度预测误差为12.18%;横向裂缝的面积预测误差仅为0.58%,其他裂缝的面积统计误差均在11%~13%之间。

参考文献
[1]
施彦, 凌天清, 崔立龙, 等. 沥青路面预防性养护评价标准及决策优化研究[J]. 公路交通科技, 2020, 37(10): 25-34, 56.
SHI Yan, LING Tian-qing, CUI Li-long, et al. Study on Evaluation Standard for Asphalt Pavement Preventive Maintenance and Decision-making Optimization[J]. Journal of Highway and Transportation Research and Development, 2020, 37(10): 25-34, 56.
[2]
于华洋, 马涛, 王大为, 等. 中国路面工程学术研究综述·2020[J]. 中国公路学报, 2020, 33(10): 1-66.
YU Hua-yang, MA Tao, WANG Da-wei, et al. Review on China's Pavement Engineering Research·2020[J]. China Journal of Highway and Transport, 2020, 33(10): 1-66. DOI:10.3969/j.issn.1001-7372.2020.10.001
[3]
卢紫微, 张燕, 常东超, 等. 基于多特征分析的路面裂缝检测算法[J]. 控制工程, 2018, 25(4): 591-595.
LU Zi-wei, ZHANG Yan, CHANG Dong-chao, et al. A Road Crack Detection Algorithm Based on Multi-feature Analysis[J]. Control Engineering of China, 2018, 25(4): 591-595. DOI:10.14107/j.cnki.kzgc.160914
[4]
JU H Y, LI W, TIGHE S, et al. Illumination Compensation Model with k-means Algorithm for Detection of Pavement Surface Cracks with Shadow[J]. Journal of Computing in Civil Engineering, 2020, 34(1): 04019049. DOI:10.1061/(ASCE)CP.1943-5487.0000869
[5]
琚晓辉, 徐凌. 基于SVM-Adaboost裂缝图像分类方法研究[J]. 公路交通科技, 2017, 34(11): 38-42.
JU Xiao-hui, XU Ling. Study on Classification Method of Crack Images Based on SVM-Adaboost[J]. Journal of Highway and Transportation Research and Development, 2017, 34(11): 38-42.
[6]
AI D, JIANG G, KEI L S, et al. Automatic Pixel-level Pavement Crack Detection Using Information of Multi-scale Neighborhoods[J]. IEEE Access, 2018, 6: 24452-24463. DOI:10.1109/ACCESS.2018.2829347
[7]
KADDAH W, ELBOUZ M, OUERHANI Y, et al. Optimized Minimal Path Selection (OMPS) Method for Automatic and Unsupervised Crack Segmentation within Two-dimensional Pavement Images[J]. The Visual Computer, 2019, 35(9): 1293-1309. DOI:10.1007/s00371-018-1515-9
[8]
张采芳, 田岩, 李江. 基于几何特征分析的路面裂缝分类算法研究[J]. 红外与激光工程, 2015, 44(4): 1359-1364.
ZHANG Cai-fang, TIAN Yan, LI Jiang. Pavement Cracks Classification Algorithm Based on Geometry Feature Analysis[J]. Infrared and Laser Engineering, 2015, 44(4): 1359-1364. DOI:10.3969/j.issn.1007-2276.2015.04.043
[9]
侯越, 陈逸涵, 顾兴宇, 等. 基于卷积自编码的沥青路面目标与裂缝智能识别[J]. 中国公路学报, 2020, 33(10): 288-303.
HOU Yue, CHEN Yi-han, GU Xing-yu, et al. Automatic Identification of Pavement Objects and Cracks Using the Convolutional Auto-encoder[J]. China Journal of Highway and Transport, 2020, 33(10): 288-303.
[10]
LAU S L H, CHONG E K P, YANG X, et al. Automated Pavement Crack Segmentation Using U-net-based Convolutional Neural Network[J]. IEEE Access, 2020, 8: 114892-114899.
[11]
孙朝云, 裴莉莉, 李伟, 等. 基于改进Faster R-CNN的路面灌封裂缝检测方法[J]. 华南理工大学学报(自然科学版), 2020, 48(2): 84-93.
SUN Zhao-yun, PEI Li-li, LI Wei, et al. Pavement Sealed Crack Detection Method Based on Improved Faster R-CNN[J]. Journal of South China University of Technology (Natural Science Edition), 2020, 48(2): 84-93.
[12]
BANG S, PARK S, KIM H, et al. Encoder-decoder Network for Pixel-level Road Crack Detection in Black-box Images[J]. Computer-Aided Civil and Infrastructure Engineering, 2019, 34(8): 713-727.
[13]
DUNG C V. Autonomous Concrete Crack Detection Using Deep Fully Convolutional Neural Network[J]. Automation in Construction, 2019, 99: 52-58.
[14]
LIU J, YANG X, LAU S, et al. Automated Pavement Crack Detection and Segmentation Based on Two-step Convolutional Neural Network[J]. Computer-Aided Civil and Infrastructure Engineering, 2020, 35(11): 1291-1305.
[15]
WOO S, PARK J, LEE J Y, et al. CBAM: Convolutional Block Attention Module[C]// Germany: Proceedings of the European Conference on Computer Vision (ECCV). Munich: Springer, 2018: 3-19.
[16]
徐风, 苗哲, 业巧林. 基于卷积注意力模块的端到端遥感图像分类[J]. 林业工程学报, 2020, 5(4): 133-138.
XU Feng, MIAO Zhe, YE Qiao-lin. End-to-end Remote Sensing Image Classification Framework Based on Convolutional Block Attention Module[J]. Journal of Forestry Engineering, 2020, 5(4): 133-138.
[17]
眭海刚, 黄立洪, 刘超贤. 利用具有注意力的Mask R-CNN检测震害建筑物立面损毁[J]. 武汉大学学报(信息科学版), 2020, 45(11): 1660-1668.
SUI Hai-gang, HUANG Li-hong, LIU Chao-xian. Detecting Building Facade Damage Caused by Earthquake Using CBAM-improved Mask R-CNN[J]. Geomatics and Information Science of Wuhan University, 2020, 45(11): 1660-1668.
[18]
HE K, ZHANG X, REN S, et al. Deep Residual Learning for Image Recognition[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas: IEEE, 2016: 770-778.
[19]
杨敏. 基于深度学习级联技术的隧道裂缝识别与分析算法研究[D]. 北京: 北京邮电大学, 2019.
YANG Min. Research of Tunnel Cracks Recognition and Analysis Algorithm Based on Deep Learning Cascade[D]. Beijing: Beijing University of Posts and Telecommunications, 2019.
[20]
CHEN L C, PAPANDREOU G, KOKKINOS I, et al. Deeplab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 40(4): 834-848.
[21]
LONG J, SHELHAMER E, DARRELL T. Fully Convolutional Networks for Semantic Segmentation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015, 39(4): 640-651.
[22]
ZHAO H, SHI J, QI X, et al. Pyramid Scene Parsing Network[C]// Honolulu: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Honolulu: IEEE, 2017: 2881-2890.