基于改进DeepLabv3+的安全帽佩戴分割算法

邵晓艳; 董文永; 赵雪专; 李玲玲; 薄树奎

doi:10.13718/j.cnki.xdzk.2025.07.016

基于改进DeepLabv3+的安全帽佩戴分割算法

1.
郑州航空工业管理学院计算机学院，郑州 450046

2.
武汉大学计算机学院，武汉 430072

基金项目: 国家自然科学基金项目(U1904119)；河南省科技攻关计划项目(252102210034)；河南省重点研发专项(231111212000)；航空科学基金项目(20230001055002)

详细信息

作者简介:
邵晓艳，硕士，副教授，主要从事机器学习、模式识别、计算机视觉等研究 .

通讯作者: 赵雪专，博士，副教授;

中图分类号: TP391

Segmentation Algorithm of Helmet Wear Based on the Improved DeepLabv3+

1.
School of Computer Science, Zhengzhou University of Aeronautics, Zhengzhou 450046, China

2.
School of Computer Science, Wuhan University, Wuhan 430072, China

摘要:
针对物流园区空间跨度大、作业设备繁多导致安全帽佩戴检测分割难度增加的问题，提出一种基于改进DeepLabv3+的安全帽佩戴分割算法。该算法采用ResNet-101膨胀残差网络进行特征提取；在编码阶段引入卷积注意力机制融合模块，有效增强特征区域表征能力；在特征提取阶段引入图像特征网格化模块，将低分辨率图像进行平均切分，有助于获得局部图像的小目标特征。将该算法在SHWD(Safety Helmet Wearing Detect)数据集中训练测试，结果表明：算法的像素准确率达到89.23%，相比DeepLabv3+提升了2.21个百分点，有效提高了复杂场景下物流园区安全帽佩戴分割精度。
- 神经网络 /
- 注意力机制 /
- 膨胀卷积 /
- 语义分割
Abstract:
To address the challenges of increased difficulty in safety helmet wearing detection and segmentation caused by large spatial spans and numerous operational equipment in logistics parks, a safety helmet wearing segmentation algorithm based on improved DeepLabv3+ was proposed. The algorithm used ResNet-101 expansion residual network to extract features. In the coding stage, the convolutional attention mechanism fusion module was introduced to effectively enhance the ability of feature region representation. In the feature extraction stage, the image feature grid module was introduced to average segmentation of low-resolution images, which was helpful to obtain small target features of local images. The algorithm was trained and tested with the Safety Helmet Wearing Detect (SHWD) Dataset, and the results showed that the pixel accuracy of algorithm reached 89.23%, which was 2.21 percentage points higher than DeepLabv3+, effectively improving the segmentation accuracy of safety helmet wearing in the logistics parks in complex scenes.
- neural network /
- attention mechanism /
- dilated convolution /
- semantic segmentation .

图 1 基于Grid-DeepLabv3+网络的语义分割架构

下载: 全尺寸图片幻灯片

图 2 膨胀卷积效果

下载: 全尺寸图片幻灯片

图 3 传统卷积模块与改进后残差网络对比

下载: 全尺寸图片幻灯片

图 4 卷积注意力机制融合模块

下载: 全尺寸图片幻灯片

图 5 图像特征网格化设计

下载: 全尺寸图片幻灯片

图 6 图像特征网格化模块

下载: 全尺寸图片幻灯片

图 7 各语义分割模型在SHWD数据集中的分割对比

下载: 全尺寸图片幻灯片

算法1 编码层网络构建算法
输入：输入特征图X_input∈R^B×C×H×W
输出：输出特征图Y_output∈R^B×C×H×W
1. 通过3×3卷积将输入特征图拆分为4部分：[X₁，X₂，X₃，X₄]←Conv_3×3(X_input)
2. 合并拆分结果：X_all←[X₁，X₂，X₃，X₄]
3. 将X_all拆分为4个子块：{X₀₀，X₁₀，X₀₁，X₁₁}←Split(X_all)
4. 拼接子块：X←Cat({X₀₀，X₁₀，X₀₁，X₁₁})
5. 对拼接结果进行1×1卷积：X←Conv_1×1(X)
6. 网格重组：X_all[index]←Backsplit(X)
7. 合并所有处理后的特征图：X←Cat(X_all)
8. 通过卷积生成最终输出Y_output

下载: 导出CSV

算法2 膨胀残差网络算法
输入：图像I∈R^C×H×W
输出：特征图F∈R^B×C×H×W
1. 残差块Conv2包含：ResidualblockConv2[i]←[Conv(1×1，64)，Conv(3×3，64)，Conv(1×1，64)]
2. 跳跃连接：Output[i]←ResidualblockConv2[i]+Input
3. 残差块Conv3：ResidualblockConv3[i]←[Conv(1×1，128)，Conv(3×3，128)，Conv(1×1，128)]
4. 跳跃连接：Output[i]←ResidualblockConv3[i]+Input
5. 残差块Conv4：ResidualblockConv4[i]←[Conv(1×1，256)，Conv(3×3，256)，Conv(1×1，256)]
6. 跳跃连接：Output[i]←ResidualblockConv4[i]+Input
7. 残差块Conv5：ResidualblockConv5[i]←[Conv(1×1，512)，Conv(3×3，512)，Conv(1×1，512)]
8. 跳跃连接：Output[i]←ResidualblockConv5[i]+Input
9. 各卷积层应用空洞卷积，膨胀率为(2，2，2，3，6)：D_Conv←DilatedConv(s=2，2，2，3，6)
10. 将空洞卷积后的多尺度特征拼接：Concat_f←Concat(D_Conv)
11. 通过1×1卷积输出特征图：F←Conv(1×1，Concat_f)

下载: 导出CSV

算法3 网格化设计特征提取算法
输入：第3层特征图X_input3∈R^B×C×H×W；第4层特征图X_input4∈R^B×C×H×W
输出：分类后的图像Y∈R^B×C×H×W
1. 将第3层特征图X_input3∈R^B×C×H×W拆分为4个子块：[X_3，1，X_3，2，X_3，3，X_3，4]←X_input3
2. 对子块进行上采样：X_3，all←Upsampling([X_3，1，X_3，2，X_3，3，X_3，4])
3. 应用融合函数fusion，遍历X_3，all中的每个子块：X_3，all[index]←fusion(X)
4. 类似地，对第4层特征图X_input4进行融合：X_4，all[index]←fusion(X)
5. 将融合后的第3层和第4层特征进行拼接：X←Concat(X_3，all+X_4，all)
6. 通过1×1卷积生成最终输出Y

下载: 导出CSV

表 1 实验环境参数配置

环境类别	设备名称	参数
硬件环境	CPU	i7 13代
	GPU	GeForce GTX 4090
	内存	32G
软件环境	操作系统	Windows 10
	编程语言	Python 3.6
	深度学习框架	PyTorch 1.10.0
		Torchvision 0.6.1
	CUDA	10.2

下载: 导出CSV

表 2 消融实验结果对比

模型	膨胀残差网络	卷积注意力机制融合模块	图像特征网格化模块	mIoU/%
DeepLabv3+				67.28
Grid-DeepLabv3+	√			68.11
	√	√		69.26
	√	√	√	71.21
注：√代表采用该方式。

下载: 导出CSV

表 3 语义分割模型实验结果对比

方法名称	P_a/%	mIoU/%	R/%	参数量/M
Unet	84.88	59.54	79.21	77.65
PSPNet	85.16	66.76	83.95	85.53
DeepLabv3+	87.02	67.28	84.12	77.72
Swin-Unet	86.72	70.32	84.46	108.50
Grid-DeepLabv3+	89.23	71.21	88.15	69.89

下载: 导出CSV

[1]	江新玲, 杨乐, 朱家辉, 等. 面向复杂场景的基于改进YOLOX_s的安全帽检测算法[J]. 南京师大学报(自然科学版), 2023, 46(2): 107-114.
[2]	张震, 李浩方, 李孟洲, 等. 改进YOLOv4的安全帽佩戴检测方法[J]. 计算机应用与软件, 2023, 40(2): 206-211, 273.
[3]	祁泽政, 徐银霞. 改进YOLOv5s算法的安全帽佩戴检测研究[J]. 计算机工程与应用, 2023, 59(14): 176-183. doi: 10.3778/j.issn.1002-8331.2303-0284
[4]	崔海彬, 蒲东兵, 陆云凤, 等. 基于CA-YOLO的安全帽佩戴检测[J]. 东北师大学报(自然科学版), 2023, 55(3): 94-100.
[5]	王贞, 邱杭, 吴斌, 等. 基于CCG-YOLOv8的施工场景下安全帽佩戴检测[J]. 武汉理工大学学报, 2024, 46(6): 73-80.
[6]	邱明明, 刘超, 胡正庭. 基于Openpose-CenterNet的不停电作业人员安全防护用具穿戴智能检测研究[J]. 武汉大学学报(工学版), 2024, 57(6): 829-836.
[7]	徐先蜂, 王轲, 马志雄, 等. 基于改进YOLOv4颈部优化网络的安全帽佩戴检测方法[J]. 重庆大学学报, 2023, 46(12): 43-54.
[8]	王晓龙, 江波. 基于改进YOLOX-m的安全帽佩戴检测[J]. 计算机工程, 2023, 49(12): 252-261.
[9]	邓珍荣, 熊宇旭, 杨睿, 等. 面向小目标的改进YOLOv5安全帽佩戴检测算法[J]. 计算机工程与应用, 2024, 60(3): 78-87.
[10]	FANG Q, LI H, LUO X C, et al. Detecting Non-Hardhat-Use by a Deep Learning Method from Far-Field Surveillance Videos[J]. Automation in Construction, 2018, 85: 1-9.
[11]	REN S Q, HE K M, GIRSHICK R, et al. Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(6): 1137-1149.
[12]	朱旭, 马淏, 姬江涛, 等. 基于Faster R-CNN的蓝莓冠层果实检测识别分析[J]. 南方农业学报, 2020, 51(6): 1493-1501.
[13]	刘雅洁, 伊力哈木·亚尔买买提, 席凌飞, 等. 改进YOLOv5s的安全帽佩戴检测算法研究[J]. 计算机工程与应用, 2023, 59(20): 184-191.
[14]	WU J X, CAI N, CHEN W J, et al. Automatic Detection of Hardhats Worn by Construction Personnel: A Deep Learning Approach and Benchmark Dataset[J]. Automation in Construction, 2019, 106: 102894.
[15]	张炳力, 王焱辉, 潘泽昊, 等. 基于障碍物和车位检测的单阶段多任务YOLO-Parking算法研究[J]. 合肥工业大学学报(自然科学版), 2024, 47(1): 1-6, 61.
[16]	田乔鑫, 孔韦韦, 滕金保, 等. 基于并行混合网络与注意力机制的文本情感分析模型[J]. 计算机工程, 2022, 48(8): 266-273.
[17]	赵志宏, 杨绍普, 马增强. 基于卷积神经网络LeNet-5的车牌字符识别研究[J]. 系统仿真学报, 2010, 22(3): 638-641.
[18]	戴天虹, 刘超. 基于改进EfficientDet的雪豹红外相机图像检测方法[J]. 哈尔滨理工大学学报, 2023, 28(2): 108-116.
[19]	刘歆, 吴小倩. 轻量化YOLOv4的安全帽佩戴检测方法[J]. 重庆邮电大学学报(自然科学版), 2023, 35(4): 671-679.
[20]	李慧琴, 宋赵铭, 刘存祥, 等. 基于YOLOv8n的番茄果实检测模型改进[J/OL]. 河南农业大学学报, (2024-05-13)[2025-05-27]. https://doi.org/10.16445/j.cnki.1000-2340.20240511.002.
[21]	徐守坤, 倪楚涵, 吉晨晨, 等. 基于YOLOv3的施工场景安全帽佩戴的图像描述[J]. 计算机科学, 2020, 47(8): 233-240.
[22]	徐先峰, 赵万福, 邹浩泉, 等. 基于MobileNet-SSD的安全帽佩戴检测算法[J]. 计算机工程, 2021, 47(10): 298-305, 313.
[23]	王玲敏, 段军, 辛立伟. 引入注意力机制的YOLOv5安全帽佩戴检测方法[J]. 计算机工程与应用, 2022, 58(9): 303-312.
[24]	吕宗喆, 徐慧, 杨骁, 等. 面向小目标的YOLOv5安全帽检测算法[J]. 计算机应用, 2023, 43(6): 1943-1949.
[25]	张锦, 屈佩琪, 孙程, 等. 基于改进YOLOv5的安全帽佩戴检测算法[J]. 计算机应用, 2022, 42(4): 1292-1300.
[26]	杨大为, 张成超. 基于改进YOLOv7的安全帽佩戴检测算法[J]. 沈阳理工大学学报, 2024, 43(1): 16-21.
[27]	冯勇, 杨思卓, 徐红艳. 基于YOLOv8的轻量化安全帽佩戴检测算法[J]. 计算机应用, 2024, 44(S2): 251-256.
[28]	HE K M, ZHANG X Y, REN S Q, et al. Deep Residual Learning for Image Recognition[C] //2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). June 27-30, 2016, Las Vegas, NV, USA. IEEE, 2016: 770-778.
[29]	汤先美, 王春宇, 闫顺丕, 等. 基于残差和卷积神经网络的生猪图像分块压缩感知[J]. 东北农业大学学报, 2023, 54(10): 70-78.

图( 7) 表( 6)

计量

文章访问数: 229
HTML全文浏览数: 229
PDF下载数: 28
施引文献: 0

全文HTML

开放科学（资源服务）标识码（OSID）：
近年来，在电子商务和供应链升级的推动下，我国物流基础设施规模持续扩大，各类物流园区数量呈现爆发式增长。根据中华人民共和国应急管理部最新发布的行业安全白皮书数据显示，在物流作业场所发生的安全事故中，因未规范佩戴安全帽防护装备而导致的伤害事件占比较高。为应对这一安全隐患，新修订的《中华人民共和国安全生产法》特别强化了物流企业在个人防护装备管理方面的主体责任。在此背景下，融合计算机视觉、深度学习等新一代信息技术的智能安全监测解决方案，正逐步成为提升物流园区安全管理水平的重要技术手段，并在物流企业中取得显著应用成效^[1-2]。

随着新一代信息技术与物流产业的深度融合，智能感知和工业互联技术为物流园区安全管理体系创新注入了新动能。一般情况下安全帽检测^[3-5]分为3种方式：①将感应设备嵌入到安全帽内；②根据形状、颜色等多个特征来进行检测；③结合深度学习算法进行智能检测。前2种检测方式操作过程比较复杂，检测速度比较缓慢。以深度学习为基础的神经网络算法，对复杂环境适应性强，且检测效率更高^[6]，因此基于深度神经网络的识别技术成为安全帽佩戴检测与监管的一种重要方法^[7-8]。

基于神经网络算法对安全帽图像进行检测和分割，实际上是采用计算机视觉研究中的语义分割算法对图像进行像素级分类^[9-10]。Ren等^[11]提出的Faster R-CNN算法相较于单阶段检测算法更加精准，可以解决多尺度、小目标问题，但速度相较于单阶段检测算法更慢^[12]。刘雅洁等^[13]在主干网络添加坐标注意力机制，提高模型对关键特征的注意力，更聚焦于训练安全帽相关目标特征并提高准确率，但对于密集小目标的检测效果不够理想。Wu等^[14]为进一步提高检测精度，将单阶段检测算法和注意力机制进行融合，但该算法同样存在对密集目标检测效果不够理想的问题^[15]。田乔鑫等^[16]改进了传统的分类算法LeNet-5^[17]，将支持向量机和神经网络进行结合，该算法因为存在后处理操作，能有效提高目标识别精度，但是在实时性上有待提高。戴天虹等^[18]引入EfficientDet算法，将预设边框用于目标检测架构，能进一步提高对小目标的检测精度。

基于工程实施场景下检测任务的高实时性要求，目前以YOLO算法为代表的单阶段目标检测算法应用较为广泛^[19-20]。其中针对安全帽佩戴检测任务的代表性研究成果有：徐守坤等^[21]基于YOLOv3系列算法进行目标检测和分割，对于安全帽给出了相应的语义描述，但在语义描述的复杂度和多样性上有待提高^[22]；王玲敏等^[23]在YOLOv5算法中引入坐标注意力机制，同时引入加权双向特征金字塔结构，可以有效预测安全帽的位置；吕宗喆等^[24]基于YOLOv5算法优化边界框回归损失函数和置信度预测损失函数的计算方式，引入切片辅助微调和切片辅助推理对输入网络的图像进行切片处理，使小目标对象产生更大的像素区域，进而改善网络推理与微调的效果从而提高安全帽佩戴检测的精确性；张锦等^[25]针对安全帽尺寸不同的问题，在YOLOv5算法中采用K-Means++算法重新聚类，再引入多光谱通道注意力机制增强信息传播并提高检测效果；杨大为等^[26]在YOLOv7算法中引入卷积块注意力机制，同时增加1个小目标层，将浅层网络特征与深层网络特征融合，提高安全帽佩戴检测精度。

针对现有安全帽检测算法参数量过多、复杂度高、对不同场景泛化能力差^[27]，以及原始DeepLabv3+网络收敛效率低、分割准确率受限的问题，提出一种端到端的基于改进DeepLabv3+的安全帽语义分割算法模型Grid-DeepLabv3+，以期提高复杂场景下物流园区安全帽佩戴的分割精度。

4. 结论

物流园区复杂场景下安全帽分割算法的研究，对保障物流园区的安全运行具有重要意义。本文针对目前安全帽分割存在模型识别精度低以及漏检误检等问题，提出了Grid-DeepLabv3+语义分割网络模型。该网络模型对DeepLabv3+网络模型进行了改进，在骨干网络中采用ResNet-101膨胀残差特征提取网络，相较于原来的Xception单元网络，解决了网络结构层数较深的问题，减小了计算量，提高了网络模型收敛速度；在编码阶段引入卷积注意力机制融合模块，有效增强了特征区域表征能力，进一步提升了图像语义分割的精度；在特征提取阶段构建了图像特征网格化模块，将低分辨率图像进行平均切分，更好地获取了物流园区复杂场景中局部区域的小目标特征信息。

本文提出的Grid-DeepLabv3+语义分割网络模型，相较于原始DeepLabv3+模型，在SHWD数据集上的像素准确率P_a提升了2.21个百分点，达到了89.23%。实验结果表明本算法在物流园区安全帽佩戴分割检测中效果良好，为物流园区复杂场景的图像检测分割提供了新的参考。

参考文献 (29)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

留言板

基于改进DeepLabv3+的安全帽佩戴分割算法

1.
郑州航空工业管理学院计算机学院，郑州 450046

2.
武汉大学计算机学院，武汉 430072

作者简介:
邵晓艳，硕士，副教授，主要从事机器学习、模式识别、计算机视觉等研究 .

通讯作者: 赵雪专，博士，副教授;

Segmentation Algorithm of Helmet Wear Based on the Improved DeepLabv3+

1.
School of Computer Science, Zhengzhou University of Aeronautics, Zhengzhou 450046, China

2.
School of Computer Science, Wuhan University, Wuhan 430072, China

计量

基于改进DeepLabv3+的安全帽佩戴分割算法

通讯作者: 赵雪专，博士，副教授;

作者简介: 邵晓艳，硕士，副教授，主要从事机器学习、模式识别、计算机视觉等研究
1. 郑州航空工业管理学院计算机学院，郑州 450046

2. 武汉大学计算机学院，武汉 430072

English Abstract

Segmentation Algorithm of Helmet Wear Based on the Improved DeepLabv3+

Corresponding author: ZHAO Xuezhuan ;

全文HTML

2.1. 膨胀卷积

2.2. 膨胀残差网络

2.3. 卷积注意力机制融合模块

2.3.1. 通道注意力模块设计

2.3.2. 空间注意力模块设计

2.4. 图像特征网格化模块

3.1. 数据集与实验环境设置

3.2. 定量评估指标

3.3. 模型消融实验结果分析

3.4. 与经典语义分割网络对比

目录

留言板

基于改进DeepLabv3+的安全帽佩戴分割算法

1. 郑州航空工业管理学院 计算机学院，郑州 450046 2. 武汉大学 计算机学院，武汉 430072

作者简介: 邵晓艳，硕士，副教授，主要从事机器学习、模式识别、计算机视觉等研究 .

通讯作者: 赵雪专，博士，副教授;

Segmentation Algorithm of Helmet Wear Based on the Improved DeepLabv3+

1. School of Computer Science, Zhengzhou University of Aeronautics, Zhengzhou 450046, China 2. School of Computer Science, Wuhan University, Wuhan 430072, China

计量

出版历程

基于改进DeepLabv3+的安全帽佩戴分割算法

通讯作者: 赵雪专，博士，副教授;

作者简介: 邵晓艳，硕士，副教授，主要从事机器学习、模式识别、计算机视觉等研究 1. 郑州航空工业管理学院 计算机学院，郑州 450046 2. 武汉大学 计算机学院，武汉 430072

English Abstract

Segmentation Algorithm of Helmet Wear Based on the Improved DeepLabv3+

Corresponding author: ZHAO Xuezhuan ;

全文HTML

2.1. 膨胀卷积

2.2. 膨胀残差网络

2.3. 卷积注意力机制融合模块

2.3.1. 通道注意力模块设计

2.3.2. 空间注意力模块设计

2.4. 图像特征网格化模块

3.1. 数据集与实验环境设置

3.2. 定量评估指标

3.3. 模型消融实验结果分析

3.4. 与经典语义分割网络对比

目录

1.
郑州航空工业管理学院计算机学院，郑州 450046

2.
武汉大学计算机学院，武汉 430072

作者简介:
邵晓艳，硕士，副教授，主要从事机器学习、模式识别、计算机视觉等研究 .

1.
School of Computer Science, Zhengzhou University of Aeronautics, Zhengzhou 450046, China

2.
School of Computer Science, Wuhan University, Wuhan 430072, China

作者简介: 邵晓艳，硕士，副教授，主要从事机器学习、模式识别、计算机视觉等研究
1. 郑州航空工业管理学院计算机学院，郑州 450046

2. 武汉大学计算机学院，武汉 430072