基于改进DeepLabV3+的丘陵田间道路图像分割方法研究

李法霖; 石军锋; 梁新成; 李云伍; 刘鹏; 陈欣

doi:10.13718/j.cnki.xdzk.2024.08.016

基于改进DeepLabV3+的丘陵田间道路图像分割方法研究

西南大学工程技术学院，重庆 400715

基金项目: 重庆市科技局项目(cstc2021jcyj-msxmX1062)；贵州省科技计划项目(黔科合支撑[2022]一般168)

详细信息

作者简介:
李法霖，硕士研究生，主要从事智能农业装备感知系统研究 .

通讯作者: 石军锋，博士，副教授，硕士研究生导师;

中图分类号: TP183

Research on Hilly Field Road Image Segmentation Method Based on Improved DeepLabV3+

College of Engineering and Technology, Southwest University, Chongqing 400715, China

摘要:
为解决丘陵地区智能农机装备因道路狭窄、路况复杂导致道路信息提取精度低和推理速度慢等问题，以丘陵田间道路作为研究对象制作数据集，提出一种基于改进DeepLabV3+的丘陵田间道路图像分割方法. 首先在编码器模块中使用轻量化的主干网络G_Ghost_RegNetX_4.0GF提取图像特征，保证精度并减小模型参数数量. 再采用轻量级的空洞空间金字塔池化模块，将不同尺度特征融合. 试验结果表明，改进模型的平均交并比和推理速度分别为87.6%及116.08 f/s，与当前主流图像分割网络FCN、DeepLabV3及PSPNet相比，MIoU分别提升了0.8%，2.2%，1%，推理速度分别为对比网络的1.33，1.83，1.76倍. 所提模型的参数总量为14.41×10⁶，浮点计算量为49.34×10⁹，模型参数及计算量大幅减小. 改进后的算法具有较高的检测精度和推理速度，有利于解决智能农机装备在丘陵田间道路上行驶的自主导航问题.
- 丘陵道路 /
- 机器视觉 /
- 场景识别 /
- 语义分割 /
- 神经网络
Abstract:
To tackle the challenges of low precision in road information extraction and slow inference speeds associated with narrow roads and complex terrain in hilly areas, it is significant to initiate the creation of a dataset, with a specific focus on hilly field roads as the research subject. It is also valuable to introduce a hilly field road image segmentation method, leveraging an enhanced DeepLabV3+ model. In the encoder module, it is crucial to integrate a lightweight backbone network, G_Ghost_RegNetX_4.0GF, which facilitated precise feature extraction while simultaneously reducing the model's parameter count. Additionally, it is necessary to incorporate the Lite-RASPP module to fuse features of varying scales. Relevant experimental findings underscore the success of this enhanced model, achieving a remarkable Mean Intersection over Union (MIoU) of 87.6% and an impressive inference speed of 116.08 f/s. When compared to prevailing image segmentation networks like FCN, DeepLabV3, and PSPNet, our model exhibited a substantial MIoU increase of 0.8%, 2.2%, and 1% respectively, while significantly outpacing them in terms of inference speed, being 1.33, 1.83, and 1.76 times faster, respectively. Furthermore, our proposed model boasted a lean parameter count of 14.41×10⁶ and a floating-point computation amount of 49.34×10⁹, substantially reducing both the model's parameters and computational demands. This optimized field image segmentation algorithm not only demonstrated enhanced detection accuracy but also delivered a superior inference speed, holding significant promise for facilitating the autonomous navigation of intelligent agricultural apparatus on hilly field roads.
- hilly roads /
- machine vision /
- scene recognition /
- semantic segmentation /
- neural networks .

图 1 履带式转运平台

下载: 全尺寸图片幻灯片

图 2 丘陵道路标注示例

下载: 全尺寸图片幻灯片

图 3 语义分割模型

下载: 全尺寸图片幻灯片

图 4 G_Ghost模块

下载: 全尺寸图片幻灯片

图 5 G_RegNetX4网络模型

下载: 全尺寸图片幻灯片

图 6 Lite-RASPP结构

下载: 全尺寸图片幻灯片

图 7 不同主干网络的训练效果曲线

下载: 全尺寸图片幻灯片

图 8 不同模型的训练效果曲线

下载: 全尺寸图片幻灯片

图 9 不同模型分割效果对比

下载: 全尺寸图片幻灯片

表 1 丘陵田间道路数据集标注信息

分类	颜色RGB	定义
背景	(0，0，0)	指不符合以下分类的目标.
道路	(112，128，144)	指转运平台及动态目标移动区域，包括水泥路、沥青路及院坝等.
动态目标	(255，0，0)	指行人(包含行人携带物品)、行驶的摩托车、移动的狗等.
障碍物	(255，255，0)	指占据路面行驶区域的石头、树干等静止物体.
水塘	(46，139，87)	指小型水体或人造水池.
天空	(135，206，250)	指未被树木大面积遮挡的天空区域.
标志牌	(0，0，255)	指道路信息和环境信息等的提示牌.
建筑	(128，0，128)	指人工修建的房屋和公共设施等.
挡墙	(244，164，96)	指固定道路两旁山体的墙面.
护栏	(128，128，128)	指果园与道路的分界物.

下载: 导出CSV

表 2 不同主干网络性能对比

主干网络	参数总量 Params	推理速度FPS/ (f·s^-1)	平均像素准确率MPA/ %	平均交并比MIoU/ %
G_RegNetX4	25.49×10⁶	73.29	82.48	75.8
MobileNetV3	11.13×10⁶	183.93	81.75	73.3
RegNet	31.89×10⁶	65.05	81.77	73.5
ResNet101	58.75×10⁶	43.14	84.21	77.1
ResNet50	39.75×10⁶	60.21	81.94	74.9

下载: 导出CSV

表 3 不同语义分割模型性能对比

网络模型	参数总量Params	推理速度FPS/(f·s^-1)	浮点计算量FLOPs
DeepLabV3	39.23×10⁶	63.23	144.26×10⁹
FCN	32.95×10⁶	86.71	122.08×10⁹
PSPnet	46.58×10⁶	65.93	156.13×10⁹
本文模型	14.71×10⁶	116.08	49.34×10⁹

下载: 导出CSV

表 4 不同语义分割模型的评价指标对比

网络模型	像素准确率PA/%	平均像素准确率MPA/%	平均交并比MIoU/%
DeepLabV3	97.7	91.44	85.4
FCN	97.7	91.78	86.8
PSPnet	97.8	91.76	86.6
本文模型	97.9	93.24	87.6

下载: 导出CSV

[1]	李云伍, 徐俊杰, 刘得雄, 等. 基于改进空洞卷积神经网络的丘陵山区田间道路场景识别[J]. 农业工程学报, 2019, 35(7): 150-159. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-NYGU201907019.htm
[2]	WANG G J, WU J, HE R, et al. Speed and Accuracy Tradeoff for LiDAR Data Based Road Boundary Detection[J]. IEEE/CAA Journal of Automatica Sinica, 2021, 8(6): 1210-1220. doi: 10.1109/JAS.2020.1003414
[3]	LU X W, AI Y F, TIAN B. Real-Time Mine Road Boundary Detection and Tracking for Autonomous Truck[J]. Sensors, 2020, 20(4): 1121. doi: 10.3390/s20041121
[4]	王小娟, 李云伍, 刘得雄, 等. 基于机器视觉的丘陵山区田间道路虚拟中线提取方法[J]. 西南大学学报(自然科学版), 2018, 40(4): 162-169. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-XNND201804022.htm
[5]	孟庆宽, 杨晓霞, 张漫, 等. 基于语义分割的非结构化田间道路场景识别[J]. 农业工程学报, 2021, 37(22): 152-160. doi: 10.11975/j.issn.1002-6819.2021.22.017
[6]	杜小强, 李卓林, 马锃宏, 等. 基于空间注意力和可变形卷积的无人机田间障碍物检测[J]. 农业机械学报, 2023, 54(2): 275-283. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-NYJX202302028.htm
[7]	XU F L, ZHAO H K, HU F Y, et al. A Road Segmentation Model Based on Mixture of the Convolutional Neural Network and the Transformer Network[J]. Computer Modeling in Engineering & Sciences, 2023, 135(2): 1559-1570.
[8]	ZHANG Y H, XIA G H, WANG J G, et al. A Multiple Feature Fully Convolutional Network for Road Extraction from High-Resolution Remote Sensing Image Over Mountainous Areas[J]. IEEE Geoscience and Remote Sensing Letters, 2019, 16(10): 1600-1604. doi: 10.1109/LGRS.2019.2905350
[9]	WANG H, CHEN Y Y, CAI Y F, et al. SFNet-N: An Improved SFNet Algorithm for Semantic Segmentation of Low-Light Autonomous Driving Road Scenes[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23(11): 21405-21417. doi: 10.1109/TITS.2022.3177615
[10]	FIRKAT E, ZHANG J L, WU D F, et al. ARDformer: Agroforestry Road Detection for Autonomous Driving Using Hierarchical Transformer[J]. Sensors, 2022, 22(13): 4696. doi: 10.3390/s22134696
[11]	LIU B S, LV Y B, GU Y, et al. Implementation of a Lightweight Semantic Segmentation Algorithm in Road Obstacle Detection[J]. Sensors, 2020, 20(24): 7089. doi: 10.3390/s20247089
[12]	TIAN F Y, HU G Z, YU S F, et al. An Efficient Multi-Task Convolutional Neural Network for Dairy Farm Object Detection and Segmentation[J]. Computers and Electronics in Agriculture, 2023, 211: 108000. doi: 10.1016/j.compag.2023.108000
[13]	YANG Z, OUYANG L, ZHANG Z G, et al. Visual Navigation Path Extraction of Orchard Hard Pavement Based on Scanning Method and Neural Network[J]. Computers and Electronics in Agriculture, 2022, 197: 106964. doi: 10.1016/j.compag.2022.106964
[14]	SHANG G G, LIU G, ZHU P, et al. A Deep Residual U-Type Network for Semantic Segmentation of Orchard Environments[J]. Applied Sciences, 2021, 11(1): 322.
[15]	LIN N C, ZHAO W F, LIANG S H, et al. Real-Time Segmentation of Unstructured Environments by Combining Domain Generalization and Attention Mechanisms[J]. Sensors, 2023, 23(13): 6008. doi: 10.3390/s23136008
[16]	BAHETI B, INNANI S, GAJRE S, et al. Semantic Scene Segmentation in Unstructured Environment with Modified DeepLabV3+[J]. Pattern Recognition Letters, 2020, 138: 223-229. doi: 10.1016/j.patrec.2020.07.029
[17]	CHEN L C, ZHU Y K, PAPANDREOU G, et al. Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation[C] //European Conference on Computer Vision(ECCV 2018). Munich, Germany. Cham: Springer, 2018: 833-851.
[18]	HAN K, WANG Y H, XU C, et al. GhostNets on Heterogeneous Devices via Cheap Operations[J]. International Journal of Computer Vision, 2022, 130(4): 1050-1069. doi: 10.1007/s11263-022-01575-y
[19]	HOWARD A, SANDLER M, CHEN B, et al. Searching for MobileNetV3[C] //2019 IEEE/CVF International Conference on Computer Vision (ICCV). Seoul, Korea (South). IEEE, 2019: 1314-1324.
[20]	HU J, SHEN L, SUN G. Squeeze-and-Excitation Networks[C] //2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City, UT, USA. IEEE, 2018: 7132-7141.
[21]	SHARMA S, BALL J E, TANG B, et al. Semantic Segmentation with Transfer Learning for Off-Road Autonomous Driving[J]. Sensors, 2019, 19(11): 2577. doi: 10.3390/s19112577
[22]	RADOSAVOVIC I, KOSARAJU R P, GIRSHICK R, et al. Designing Network Design Spaces[C] //2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Seattle, WA, USA. IEEE, 2020: 10425-10433.
[23]	HE K M, ZHANG X Y, REN S Q, et al. Deep Residual Learning for Image Recognition[C] //2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Las Vegas, NV, USA. IEEE, 2016: 770-778.
[24]	CHEN L C, PAPANDREOU G, SCHROFF F, et al. Rethinking Atrous Convolution for Semantic Image Segmentation[EB/OL]. (2017-12-05)[2023-08-15]. http://arxiv.org/abs/1706.05587.
[25]	ZHAO H S, SHI J P, QI X J, et al. Pyramid Scene Parsing Network[C] //2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Honolulu, HI, USA. IEEE, 2017: 6230-6239.

图( 9) 表( 4)

计量

文章访问数: 1485
HTML全文浏览数: 1485
PDF下载数: 267
施引文献: 0

全文HTML

开放科学（资源服务）标识码（OSID）：
中国总面积的70%左右为丘陵山地，大约56%的人口居住在这些区域^[1]. 随着城镇化进程的加速，农村劳动力向城市的持续转移导致部分耕地荒废，这一趋势可能危及国家粮食安全. 因此，提高丘陵地区的农业智能化水平对于保障农业正常生产和推进农业现代化具有至关重要的意义. 精准识别道路行驶区域是智能农机装备搭载视觉系统的主要目的，由于丘陵田间道路具有狭窄蜿蜒、起伏大、路况复杂等特点，所提取行驶区域的道路信息难以保证智能农机装备的自主导航. 因此，精确、实时的丘陵田间道路信息提取就变得尤为重要.

在道路信息提取研究中，传统的方法包括边缘检测和阈值分割等^[2-4]，但这些方法在处理复杂道路环境时准确率不高. 近年来，随着神经网络技术的发展，语义分割逐渐成为了道路信息提取的主流方法. 孟庆宽等^[5]提出一种基于通道注意力结合多尺度融合的轻量级语义分割模型，实现对非结构化田间道路场景的识别. 但MobileNetV2作为主干网络采用深度可分离卷积，易出现信息丢失和梯度消失等问题从而导致分割精度下降. 杜小强等^[6]提出一种优化Mask R-CNN模型的非结构化农田障碍物实例分割方法，引入可变形卷积增大感受野并提高模型的鲁棒性. 但可变形卷积的输出结果与初始位置有关，可能导致可变形卷积输出结果偏差较大从而影响模型的分割性能. Xu等^[7]提出一种将Transformer与卷积神经网络(CNN)结合的MCTNet网络结构，模型基于Encoder-Decoder在CNN和Transformer独自运行后再融合输出特征，缺点是融合模块难以平衡各种特征的权重，可能出现信息冲突及分割目标错误的情况. Zhang等^[8]在FCN基础上提出了一种多特征全卷积网络，通过RGB图像与DEM图像结合以提取山地道路区域. 不足之处是仅使用一次上采样将特征图恢复到原图尺寸大小，可能影响细节和边缘信息的精确表达. Wang等^[9]提出一种针对夜间道路场景的语义分割模型SFNet-N，虽然模型提高了增强后图像的真实性，但试验结果表明其准确率和实时性还存在不足. Firkat等^[10]提出一种用于农林业环境非结构化道路检测方法ARDformer，虽然试验结果表明其性能大大优于SOTA道路检测方法，但计算成本过大且推理速度较慢. Liu等^[11]基于图像级联网络(ICNet)架构提出一种轻量级实时语义分割网络，通过提取不同层次特征避免了概率图模型引起的大量计算和内存消耗的问题，但该网络易产生分割边缘模糊和不准确的问题. Tian等^[12]提出一种多任务学习GCS-MUL算法，将卷积块注意力模块(CBAM)作为整个模型的骨干，设计的轻量级目标特征提取网络Ghost CBAM(GCNet)提高了模型分割精度并减小了模型参数量，但多任务学习的相互作用会出现检测目标的漏检. 对于田间果园非结构化路面，大多使用基于Encoder-Decoder结构的Unet模型提取果园道路信息^[13-14]，但由于数据集的不充分及编码器卷积层的堆叠，影响提取上下文信息导致部分目标的分割精度较低. Lin等^[15]提出一种非结构化场景的实时语义分割模型，通过融合领域泛化和注意力机制增强其在复杂无组织环境的能力，但使用轻量化的主干网络对稀有类别的感知有限可能导致分割边界模糊. Baheti等^[16]基于非结构化道路对DeepLabV3+语义分割网络进行改进，加入膨胀卷积的Xceptions作为主干网络，试验结果表明在流量较大的复杂环境中会出现部分重叠目标分割错误的情况. 总之，上述研究基于深度神经网络对道路图像进行语义分割，相比于传统方法其性能有了较大提升，但也存在分割精度与模型参数量平衡的问题.

本文以丘陵田间道路作为研究对象，采集田间道路图像构造数据集，基于DeepLabV3+网络将轻量化的G_Ghost_RegNetX_4.0GF作为主干网络搭建语义分割模型，引入轻量级空洞空间金字塔池化模块(Lite-RASPP)将多尺度特征融合. 通过对复杂的丘陵田间道路图像进行语义分割，实时精确地提取可行驶区域和动态目标等有效信息，为智能农机装备的自主导航研究奠定基础.

4. 结论

提出一种基于优化DeepLabV3+的丘陵田间道路图像语义分割模型，编码器环节采用轻量化的主干网络(G_RegNetX4)和轻量级的Lite-RASPP模块，在明显提升分割精度和推理速度的同时降低了参数总量和浮点计算量. 通过采集丘陵田间道路图像建立数据集并将对象属性划分为10个类别，构建测试集以进行模型分割效果测试. 结果表明所提出模型的平均交并比和平均像素准确率分别为87.6%，93.24%，具有准确率高及泛化性能好的优点. 将本文模型与FCN、DeepLabV3和PSPNet进行比较，发现其可以有效对丘陵田间道路进行分割，较好地实现了精度与速度的平衡. 考虑到未对分割后的田间道路场景图像提取视觉导航线，后续将进行相关研究以期更好地实现智能农机装备的自主导航.

参考文献 (25)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

留言板

基于改进DeepLabV3+的丘陵田间道路图像分割方法研究

西南大学工程技术学院，重庆 400715

作者简介:
李法霖，硕士研究生，主要从事智能农业装备感知系统研究 .

通讯作者: 石军锋，博士，副教授，硕士研究生导师;

Research on Hilly Field Road Image Segmentation Method Based on Improved DeepLabV3+

College of Engineering and Technology, Southwest University, Chongqing 400715, China

计量

基于改进DeepLabV3+的丘陵田间道路图像分割方法研究

通讯作者: 石军锋，博士，副教授，硕士研究生导师;

作者简介: 李法霖，硕士研究生，主要从事智能农业装备感知系统研究
西南大学工程技术学院，重庆 400715

English Abstract

Research on Hilly Field Road Image Segmentation Method Based on Improved DeepLabV3+

Corresponding author: SHI Junfeng ;

全文HTML

1.1. 试验平台和设备

1.2. 田间道路数据集制作

1.2.1. 图像采集

1.2.2. 数据集制作

2.1. 模型构建思路

2.2. 主干网络

2.3. 轻量级空洞空间金字塔池化模块

3.1. 训练环境

3.2. 模型训练

3.3. 评价指标

3.4. 主干网络验证

3.5. 模型性能试验

目录

留言板

基于改进DeepLabV3+的丘陵田间道路图像分割方法研究

西南大学 工程技术学院，重庆 400715

作者简介: 李法霖，硕士研究生，主要从事智能农业装备感知系统研究 .

通讯作者: 石军锋，博士，副教授，硕士研究生导师;

Research on Hilly Field Road Image Segmentation Method Based on Improved DeepLabV3+

College of Engineering and Technology, Southwest University, Chongqing 400715, China

计量

出版历程

基于改进DeepLabV3+的丘陵田间道路图像分割方法研究

通讯作者: 石军锋，博士，副教授，硕士研究生导师;

作者简介: 李法霖，硕士研究生，主要从事智能农业装备感知系统研究 西南大学 工程技术学院，重庆 400715

English Abstract

Research on Hilly Field Road Image Segmentation Method Based on Improved DeepLabV3+

Corresponding author: SHI Junfeng ;

全文HTML

1.1. 试验平台和设备

1.2. 田间道路数据集制作

1.2.1. 图像采集

1.2.2. 数据集制作

2.1. 模型构建思路

2.2. 主干网络

2.3. 轻量级空洞空间金字塔池化模块

3.1. 训练环境

3.2. 模型训练

3.3. 评价指标

3.4. 主干网络验证

3.5. 模型性能试验

目录

西南大学工程技术学院，重庆 400715

作者简介:
李法霖，硕士研究生，主要从事智能农业装备感知系统研究 .

作者简介: 李法霖，硕士研究生，主要从事智能农业装备感知系统研究
西南大学工程技术学院，重庆 400715