公路交通科技  2022, Vol. 39 Issue (7): 23-29

扩展功能

文章信息

段明义, 李祖照, 崔奥杰
DUAN Ming-yi, LI Zu-zhao, CUI Ao-jie
基于改进t分布混合模型的路面裂缝图像分割方法研究
Study on Segmentation Method of Pavement Crack Image Based on Improved t-distribution Mixture Model
公路交通科技, 2022, 39(7): 23-29
Journal of Highway and Transportation Research and Denelopment, 2022, 39(7): 23-29
10.3969/j.issn.1002-0268.2022.07.004

文章历史

收稿日期: 2021-01-20
基于改进t分布混合模型的路面裂缝图像分割方法研究
段明义1 , 李祖照2 , 崔奥杰1     
1. 郑州工程技术学院 信息工程学院,河南 郑州 450044;
2. 广西交科集团有限公司,广西 南宁 530007
摘要: 公路投入运行后,根据车流量以及车型的不同,随时间的发展会产生各种损害,为及时了解掌握公路健康状态,需对其进行监测。路面裂缝是一个重要的监测指标,根据裂缝的类型,可以判断成因并采取相应的补救措施。使用计算机技术进行裂缝检测具有高效、非接触、精度高等优点,常用的是图像分割技术。为增加图像分割的准确性同时提高其抗噪性,首先,利用学生t分布本身固有的特性以及与柯西分布、高斯分布的关系来改进群智能花粉算法。其次,利用该改进后的花粉算法来优化K-means聚类。最后,根据裂缝图像的特点,在模型采用方面,通过对常用概率模型特征的分析,选用t分布而不是高斯模型来构建有限混合模型,以此为基础,提出更适应于公路裂缝图像的分割方法。该方法在局部寻优以及全局寻优方面都有较好的表现,用来快速求解模型参数初始状态值。参数求解采用常用的EM算法,最终实现图像分割。试验部分构造了软硬件环境以验证本研究所提方法的性能,试验数据图像主要来自于人工仿真合成图像以及道路养护人员拍摄到的实际路面裂缝图像。算法运行结果也表明了本改进方法的正确性,本算法分割结果图像具有更高的精度,同时抗噪性更强,具有一定的应用价值。
关键词: 道路工程     图像分割     K-Means     学生t分布混合模型     花粉算法     EM算法    
Study on Segmentation Method of Pavement Crack Image Based on Improved t-distribution Mixture Model
DUAN Ming-yi1, LI Zu-zhao2, CUI Ao-jie1    
1. School of Information Engineering, Zhengzhou University of Technology, Zhengzhou Henan 450044, China;
2. Guangxi Transportation Science & Technology Group Co., Ltd., Nanning Guangxi 530007, China
Abstract: After highway is put into operation, various damages will occur with time according to the traffic volume and the vehicle type. In order to keep abreast of the road health status, it is necessary to monitor it. Pavement cracks are an important monitoring indicator. According to the type of cracks, the cause can be determined and corresponding remedial measures can be taken. The use of computer technology for crack detection has the advantages of high efficiency, non-contact and high precision, and the commonly used technology is image segmentation. In order to increase the accuracy of image segmentation and improve its anti-noise, first, the swarm intelligence flower pollination algorithm (FPA) is improved by using the inherent characteristics of student's t-distribution and its relationship with Cauchy distribution and Gaussian distribution. Second, the K-means clustering is optimized by using the improved flower pollination algorithm. Finally, according to the characteristics of crack images, in terms of model adoption, through the analysis of the characteristics of common probability models, a finite mixture model is constructed by using student's t-distribution instead of Gaussian model. Based on this, a segmentation method more suitable for highway crack images is proposed. The method has good performance in local optimization and global optimization, and is used to quickly solve the initial state value of model parameters. The parameter solution adopts the commonly used EM algorithm, and finally realizes the image segmentation. In the experiment section, a hardware and software environment is constructed to verify the performance of the proposed method. The experimental data images are mainly come from artificial simulation synthetic images and actual pavement crack images captured by road maintenance personnel. The running result of the algorithm also showed the correctness of the proposed improved method. The segmentation result of this algorithm has higher accuracy and stronger noise resistance, which has certain application value.
Key words: road engineering     image segmentation     K-means     student's t-distribution mixture model     flower pollination algorithm     EM algorithm    
0 引言

近20年来,伴随着我国交通事业的发展,汽车保有量也随之迅猛增长,人们对行车的要求也在不断转变,尤其体现在安全性、经济性以及舒适性等方面的需求。这使得路面养护变得重要和紧急[1]。目前,对于公路状况的检测手段,国内外常见的是人工方法和半自动方法,这些方法的缺点是效率低、强度大以及准确性不够等。道路在投入使用后,随着使用年限的增长,会产生不同程度的裂缝,裂缝是评价公路质量的一个重要指标。裂缝的类型和裂缝的程度关系后期的维护修补策略[2]。相对于采用人工检测的方法,利用计算机技术进行裂缝检测具有高效、非接触、精度高等优点,图像分割是其中最常用到的技术之一。

一种常用的图像分割方法是K-means聚类划分[3],原理简单、易实现,缺点是参数值的设置需要事先由人工来完成。同时,该方法在含噪声图像上运行效果欠佳[4]。因此,实际应用中,一般需要对标准K-means聚类进行优化,然后再使用其进行分割。本研究采用花粉算法(Flower Pollination Algorithm,FPA)[5]来对其进行改进,该算法参数少,易实现。数理统计中,比较常用的数据模拟模型是高斯模型[6],随着待模拟数据量的增加,可以采用多个高斯模型加权的形式来构造模型进行模拟,即高斯混合模型(Gaussian Mixture Model, GMM)[7]。学生t分布(Student’s t-distribution)[8]是另一个常见的数据模型,具有较长的尾部,更适合用来处理裂缝图像,因此,本研究采用其来代替高斯分布,多数据模拟的情况采用t分布混合模型(t-distribution Mixture Model, TMM)[9]

在本研究中,针对公路裂缝图像的特点,以t分布混合模型为基础,对其在参数优化和求解方面进行改进,本研究方法为K-means改进t混合模型法(K-means Improved t distribution Mixture Model,KITMM)。

1 方法 1.1 学生t分布

学生t分布的概率密度函数为:

(1)

式中,v为自由度参数,Γ(·)为Gamma函数。根据文献[10]可知,通过调整自由度参数v,可以将t分布调整为柯西分布或高斯分布,从而实现自适应变异。

1.2 聚类算法 1.2.1 K-means算法

对于含有N个数据点的裂缝图像,这N个数据点分别为X={x1, x2, …, xN},其中xi表示像素灰度值。K-means算法利用预设的聚类个数值K,将裂缝图像自动划分为K个部分M1, M2, …, MK,每个部分称为一个子集或者聚类,其中心分别为c1, c2, …, cK

其目标函数如式(2)所示:

(2)

式中x为来自裂缝图像子集Mj的样本。

当目标函数取得最小值时,利用式(3)计算并更新各聚类中心c1, c2, …, cK

(3)

式中,cj为子集中心,Nj为子集样本个数。聚类算法主要采用迭代的方法,逐步更新子集位置,直至不再更新或者满足预设迭代次数为止。

虽然原理简单且易实现,但标准K-means缺点也很明显,每次运行算法前都要进行参数设置,在有些情况下,这一步不容易实现,本研究对此采用花粉算法改进提高。

1.2.2 花粉算法

自然界中的显花植物,经过亿万年的演化史,已经发展出来一种独特的、行之有效的授粉方式。花粉算法(Flower Pollination Algorithm,FPA)[5]主要采用全局和局部两种授粉方式,两者之间可以通过参数p控制转换的概率,p∈[0, 1]。

鉴于植物与动物的不同,其活动性基本为0,授粉大部分发生在局部区域,即局部授粉在总体授粉活动中占很大比例p。根据文献[5],p=0.8。设种群规模为Ni∈[1, N],X代表种群中的花朵。

全局授粉方式为:

(4)
(5)

式中,xitxit+1分别为第tt+1次迭代的花朵; γ为常数,缩放因子,控制步长; L为Levy分布函数[11]; g*为种群中最优值;Γ(λ)表示Gamma函数,此处λ=1.5;式(5)中的s可采用式(6)求解,

(6)
(7)

局部授粉方式为:

(8)

式中,xjtxkt为第t次迭代时种群中的两朵花,随机选取; ε为[0, 1]之间随机数,均匀分布。

授粉步骤执行结束后,为了对个体值进行规范,利用式(9)对xt+1i值进行判断,使其最终落入区间[blow, bhigh]中:

(9)

利用式(10)~(11)进行更新:

(10)
(11)

式中,fit为算法求解过程中使用的适应度函数。算法运行结束时,输出g*fit(g*)。

实际运行中,FPA算法前期易落入局部最优,后期逼近最优点的速度较慢。本研究采用改进方法,该方法主要借鉴文献[12],对花粉状态Xi=(xi1, xi2, …, xin)进行自适应t分布变异,定义如下:

(12)

式中,xixit分别为执行变异操作前后第i个花粉所处位置,Iteration为到目前为止,算法已经循环执行迭代的次数,t(Iteration)为自由度参数为Iteration的学生t分布。式(12)在第i个花粉位置上面叠加一个与算法迭代次数Iteration相关的随机干扰项,以避免算法落入局部极值点。该干扰项采用学生t分布形式,迭代前期,t分布接近柯西分布,有利于进行全局搜索; 迭代后期,t分布接近高斯分布,有利于进行局部搜索。

本研究首先运行FPA算法获得一个初始解,然后以该解为输入,运行K-means算法,发挥其特性进行局部寻优,聚类结束,求取一个最优解。然后将该解作为下一步混合模型参数求解的初始值。

1.3 t分布混合模型

学生t分布(Student’s t-distribution)是除高斯分布之外另一常用的分布,它较高斯分布具有更长的尾部,更适合用来模拟裂缝图像。

多维(p维)学生t分布可以用式(13)表示:

(13)

式中,δ(x, μ; Σ)=(x-μ)TΣ-1(x-μ)。采用与高斯模型相似的方法,将多个学生t分布模型进行加权,即学生t分布混合模型[9],如式(14)所示。

(14)

式中πk为混合系数。

有限混合模型中未知参数的求解有很多种方法,本研究中采用EM算法[13]

E步:

(15)
(16)
(17)
(18)
(19)

式中,vi(k+1)的值可以通过求解式(20)得出:

(20)

式中,ψ(x)={∂Γ(x)/∂x}/Γ(x),ni(k)=(i=1, …, K)。

重复执行式(15)~(16)的E步,以及式(17)~(19)的M步,直到满足结束条件,即可求出混合模型的参数,从而确定该模型。利用贝叶斯公式,可计算每个像素的后验概率以确定其所属类别,完成最终分割过程。

1.4 算法流程图

算法整体流程如图 1所示。

图 1 算法流程图 Fig. 1 Flowchart of algorithm

2 试验结果与分析 2.1 试验环境及评价准则

试验环境由软件和硬件两方面组成,软件方面主要为Matlab 2012b,硬件方面主要为8 GB内存,Intel 3.2 GHz CPU以及2T硬盘。试验图像主要由合成图像以及实际公路裂缝图像组成。合成图像由Photoshop软件生成,实际裂缝图像由道路养护人员现场采集。

试验部分主要通过以下两个指标值来对算法性能进行衡量:误分率(MCR)[14]和概率随机(PR)索引[15]

(21)

式中,MCR取值位于[0, 1]区间,其值越小表示分割结果越好。Ne为误分像素数; N为像素总数。

概率随机索引PR定义为式(22)。

(22)

式中cij=1表示在测试分割结果Stest中像素ij属于同一聚类,否则cij=0。pij的值可以利用式(23)定义的样本均值估计得到。

(23)

式中K表示基准集的个数,∐(liSk=ljSk)是一个恒等函数,当像素ij属于基准集中同一聚类时,它的值等于1,否则它的值为0。PR∈[0, 1],值越大表示分割效果越好。

2.2 结果与分析

试验部分主要在合成[16]和实际两类图像上进行分割, 以对本研究算法的性能进行验证。

对比算法包括TMM[9],SMM-AM[17],SCSMM[18],本研究方法为KITMM。

试验方案为:首先在噪声污染后的合成图像上运行本研究算法以测试其有效性, 然后将该算法在真实裂缝图像上运行,同时运行对比算法以测试其优越性。

2.2.1 合成图像试验结果与分析

图 2(a)~(c)分别为合成图像原图以及含噪声图像,图 2(d)(e)为分割结果。

图 2 合成图像分割结果 Fig. 2 Synthesis image segmentation result

图 2结果显示,本研究方法在含噪声图像上也能够实现分割,这说明算法具有抗噪性。图 3为在不同噪声水平下分割算法鲁棒性测试结果。

图 3 分割算法鲁棒性测试结果 Fig. 3 Test results of robustness of segmentation algorithm

图 3结果显示,算法分割误差随着噪声的增大而增加,说明噪声对算法有影响,但整个曲线增幅不大,说明算法抗噪性好。

2.2.2 实际路面裂缝图像试验结果与分析

为进一步测试本研究算法的有效性,取4种公路裂缝样本,如图 4(a1)(b1)(c1)(d1)分别运行各对比算法,进行分割。其中图 4(a1)(b1)为单条裂缝,图 4(c1)(d1)为网状裂缝。

图 4 实际裂缝图像分割结果对比 Fig. 4 Comparison of actual crack image segmentation results

图 4结果显示,4种算法都能够将公路裂缝部位分割出来,但分割效果不同。传统t混合模型(TMM)和自适应均值滤波t混合模型分割的结果中,除了裂缝本身,还含有一些其他的背景信息。样本1因为背景比较单一,该问题不是很突出。样本2中表现比较明显,样本3结果中,TMM方法具有较多背景信息,SMM-AM方法背景信息主要集中在图形上部区域,样本4中主要集中在左侧区域。这些部位,因为灰度值较大,被保留了下来。基于马尔科夫随机场的t混合模型分割结果,与其他3种算法分割结果相比,对裂缝部位保留得最好,且其他部位剔除得最干净,但其分割出来的裂缝部位,不够清晰,存在断裂现象,比如样本2的右侧部分,样本3的左侧两支裂缝,以及样本4的中部和下部,都存在断裂。本研究方法(KITMM)分割的结果,优于其他3种算法,在最大限度保留裂缝部位信息的同时,也能够分割出清晰的裂缝图像。定量结果如表 1所示。

表 1结果表明,从评价指标MCRPR来看,本研究算法各图像分割结果都较优。时间指标表明本研究算法处于劣势,原因在于对分割算法的改进增大了算法本身的复杂度,从而消耗了更多的运行时间,也即是在提高分割效果的同时,增加了时间成本。

表 1 定量评估结果 Tab. 1 Quantitative evaluation result
方法 MCR/% PR 时间/s 方法 MCR/% PR 时间/s
样本1 TMM 27.1 0.801 65.7 样本3 TMM 26.8 0.821 60.7
SMM-AM 21.2 0.787 73.8 SMM-AM 22.7 0.805 74.1
SCSMM 18.4 0.798 89.2 SCSMM 16.4 0.788 82.3
KITMM 3.8 0.889 112.7 KITMM 3.9 0.899 99.2
样本2 TMM 24.3 0.812 65.4 样本4 TMM 23.6 0.802 61.6
SMM-AM 22.1 0.799 75.9 SMM-AM 21.9 0.811 73.9
SCSMM 17.4 0.803 85.4 SCSMM 15.2 0.756 83.5
KITMM 3.7 0.893 102.3 KITMM 3.6 0.909 104.8

3 结论

在分析公路裂缝图像特点之后,本研究基于t分布模型构造一种图像分割方法,主要用来实现公路裂缝图像分割。该方法主要在模型初始参数计算、模型最终参数求解等方面进行改进提高分割效果。试验部分构造了软硬件环境,仿真图像和实际公路裂缝图像测试结果表明改进算法抗噪性强,精度高并且分割效果好。

参考文献
[1]
彭博, 蒋阳升, 韩世凡, 等. 路面裂缝图像自动识别算法综述[J]. 公路交通科技, 2014, 31(7): 19-25.
PENG Bo, JIANG Yang-sheng, HAN Shi-fan, et al. A Review of Automatic Pavement Crack Image Recognition Algorithms[J]. Journal of Highway and Transportation Research and Development, 2014, 31(7): 19-25.
[2]
琚晓辉, 徐凌. 基于SVM-Adaboost裂缝图像分类方法研究[J]. 公路交通科技, 2017, 34(11): 38-42.
JU Xiao-hui, XU Ling. Study on Classification Method of Crack Images Based on SVM-Adaboost[J]. Journal of Highway and Transportation Research and Development, 2017, 34(11): 38-42.
[3]
王景春, 林佳秀, 靳俊中. 基于改进K-means聚类模型的公路隧道施工风险分析及其应用[J]. 公路交通科技, 2019, 36(6): 58-64.
WANG Jing-chun, LIN Jia-xiu, JIN Jun-zhong. Analysis on Highway Tunnel Construction Risk Based on Improved K-means Clustering Model and Application[J]. Journal of Highway and Transportation Research and Development, 2019, 36(6): 58-64.
[4]
杨雨航. 动态粒子群优化K-means的图像分割算法研究[J]. 现代计算机(专业版), 2019(8): 63-67.
YANG Yu-hang. Image Segmentation Algorithm Based on Improved Particle Swarm Optimization and K-means Clustering[J]. Modern Computer, 2019(8): 63-67.
[5]
YANG X S. Flower Pollination Algorithm for Global Optimization[C]// International Conference on Unconventional Computing and Natural Computation, Berlin: Springer, 2012: 240-249.
[6]
尹楠. 基于高斯混合模型的期望最大化聚类算法[J]. 统计与决策, 2017(4): 87-89.
YIN Nan. The Expectation Maximization Clustering Algorithm Based on Gaussian Mixture Model[J]. Statistics & Decision, 2017(4): 87-89.
[7]
陈雨, 汪凡, 陈雨人. 低等级公路行车速度分布与行车环境协调性分析[J]. 公路交通科技, 2019, 36(8): 115-123.
CHEN Yu, WANG Fan, CHEN Yu-ren. Analysis on Driving Speed Distribution and Driving Environment Coordination on Low-grade Highways[J]. Journal of Highway and Transportation Research and Development, 2019, 36(8): 115-123.
[8]
贾海宁, 王士同. 面向重尾噪声的模糊规则模型[J]. 南京大学学报(自然科学), 2019, 55(1): 61-72.
JIA Hai-ning, WANG Shi-tong. Rule-based Fuzzy Model for Heavy-tailed Noisy Data[J]. Journal of Nanjing University (Natural Science Edition), 2019, 55(1): 61-72.
[9]
PEEL D, Mclachlan G. Robust Mixture Modelling Using the t-distribution[J]. Statistics and Computing, 2000, 10(4): 339-348.
[10]
JEONG W, KANG M J, KIM S W, et al. Full Waveform Inversion Using Student's t Distribution: A Numerical Study for Elastic Waveform Inversion and Simultaneous-source Method[J]. Pure and Applied Geophysics, 2015, 172(6): 1491-1509.
[11]
PAVLYUKEVICH I. Levy Flights, Non-local Search and Simulated Annealing[J]. Computational Physics, 2007, 226(2): 1830-1844.
[12]
王波. 基于自适应t分布混合变异的人工鱼群算法[J]. 计算机工程与科学, 2013, 35(4): 120-124.
WANG Bo. Artificial Fish-school Algorithm Based on Adaptive t Distribution Mixed Mutation[J]. Computer Engineering & Science, 2013, 35(4): 120-124.
[13]
YAO W, WEI Y, YU C. Robust Mixture Regression Using the t-distribution[J]. Computational Statistics & Data Analysis, 2014, 71(3): 116-127.
[14]
ZHANG Y, BRADY M, SMITH S. Segmentation of Brain MR Images through a Hidden Markov Random Field Model and the Expectation Maximization Algorithm[J]. IEEE Transaction on Medical Imaging, 2001, 20(1): 45-57.
[15]
UNNIKRISHNAN J R, PANTOFARU C, HEBERT M. A Measure for Objective Evaluation of Image Segmentation Algorithms[C]// Proceedings of the 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. San Diego: IEEE, 2005: 34-41.
[16]
NGUYEN T M, WU Q M J. Robust Student's-t Mixture Model with Spatial Constraints and Its Application in Medical Image Segmentation[J]. IEEE Transactions on Medical Imaging, 2012, 31(1): 103-116.
[17]
杨云飞. 基于有限混合模型的医学图像分割算法应用研究[D]. 南京: 东南大学, 2015.
YANG Yun-fei. Study of Medical Image Segmentation Algorithm Based on Finite Mixture Model[D]. Nanjing: Southeast University, 2015.
[18]
李璐, 范文涛, 杜吉祥. 基于Markov随机场的Student's t混合模型的脑MR图像分割[J]. 山东大学学报(工学版), 2017, 47(3): 49-55.
LI Lu, FAN Wen-tao, DU Ji-xiang. Brain MR Image Segmentation Based on Student's t Mixture Model with Markov Random Field[J]. Journal of Shandong University (Engineering Science Edition), 2017, 47(3): 49-55.