基于改进YOLOv5的鸽子蛋壳破损检测

杨航; 何皓明; 李滕科; 王嘉雯; 吴霆; 钟乐; 邹娟; 杨灵

doi:10.13718/j.cnki.xsxb.2023.08.011

基于改进YOLOv5的鸽子蛋壳破损检测

仲恺农业工程学院信息科学与技术学院/广东省食品安全溯源与控制工程技术研究中心，广州 510225

基金项目: 广东省重点领域研发计划项目(2021B0202030001, 2019B020215001); 国家自然科学基金项目(31872606); 广州市重点研发计划项目(202103000067, 201803020033, 202002030154); 广东省教育厅乡村振兴重点领域专项(2020ZDZX1060); 广东省自然科学基金(2018A0303130034, 2020A1515010834); 广东省教育厅创新强校特色创新项目(2018KTSCX096); 广东省省级科技计划项目(2017A020225042); 广东省现代农业产业技术体系创新团队建设专项(2019KJ141, 2020KJ138)

详细信息

作者简介:
杨航，硕士研究生，主要从事人工智能研究 .

通讯作者: 邹娟，讲师，硕士研究生导师;

中图分类号: TP181

Detection of Pigeon Eggshell Breakage Based on Improved YOLOv5

School of Information Science and Technology, Zhongkai University of Agriculture and Engineering/Guangdong Provincial Food Safety Traceability and Control Engineering Technology Research Center, Guangzhou 510225, China

摘要:
破损鸽蛋检测是鸽蛋分拣过程中最重要的步骤之一. 为解决破损鸽蛋实时检测问题，提出一种改进YOLOv5的破损鸽蛋检测方法. 首先，为解决鸽蛋细微裂纹检测难的问题，采用Kmeans聚类算法计算细微裂纹锚框适应度，在head模块增加Anchor值为[7, 9, 13, 8, 9, 12]的检测层，从而提高细微裂纹图像的特征提取能力；其次，为解决裂纹特征权重较低的问题，采用融合反向最大池化层的注意力机制，将色值权重提高，从而增强裂纹特征的权重；再次，为解决检测模型负向梯度消失问题，采用Hardswish激活函数的全连接层替换ReLU激活函数的全连接层，解决输入为负时存在的神经元坏死问题，确保神经网络误差正常反馈. 最后，基于改进YOLOv5方法建立鸽蛋裂纹识别模型，采用7∶2∶1交叉验证方法对模型进行验证. 经对比验证，改进YOLOv5模型的检测效果有明显提升，其准确率、召回率和平均精度分别达到98%，97.3%和98.3%，比原始YOLOv5模型分别提高了14.8%，6.2%和3.4%，检测速度大约为111帧/s，且模型大小仅为4.6 Mb，为鸽蛋破损检测提供了一种新方法.
- 鸽子蛋 /
- YOLOv5 /
- 裂纹检测 /
- Hardswish /
- 最大池化层
Abstract:
Pigeon egg broken detection is one of the most important steps in the pigeon egg sorting process. In order to solve the problem of real-time detection of damaged pigeon eggs, this paper proposed a method to improve YOOv5's detection of damaged pigeon eggs. First, in order to solve the difficulty of pigeon egg fine crack detection, the Kmeans clustering algorithm was used to calculate the fitness of the fine crack anchor frame, and the detection layer with the anchor value of [7, 9, 13, 8, 9, 12] was added to the head module to improve the feature extraction ability of the fine crack image; Secondly, in order to solve the problem of low weight of crack characteristics, the attention mechanism of fusing the reverse maximum pool layer was adopted to increase the weights of crack color value, thus enhancing the weight of crack characteristics; Thirdly, in order to solve the problem of the disappearance of the negative gradient of the detection model, the full connection layer of the Hardswish activation function was used to replace the full connection layer of the ReLU activation function, to solve the problem of neuron necrosis when the input is negative, and to ensure the normal feedback of the neural network error. Finally, the pigeon egg crack identification model was established based on the improved YOLOv5 method, and the 7:2:1 cross validation method was used to verify the model. Through comparison and verification, the detection effect of the improved model of YOLOv5 in this paper has been significantly improved, with its accuracy, recall and average accuracy reaching 98%, 97.3% and 98.3% respectively, which was 14.8%, 6.2% and 3.4% higher than the YOLOv5. The detection speed was about 111 frames/s, and the model size was only 4.6Mb. This provides a new method for detecting broken pigeon eggs.
- pigeon egg /
- YOLOv5 /
- crack detection /
- Hardswish /
- Maxpool .

图 1 YOLOv5网络结构

下载: 全尺寸图片幻灯片

图 2 激活函数ReLU的全连接层降维结果

下载: 全尺寸图片幻灯片

图 3 两种激活函数的降维结果对比

下载: 全尺寸图片幻灯片

图 4 ReLU，swish，Hardswish激活函数及其导数

下载: 全尺寸图片幻灯片

图 5 SE注意力机制以及改进后的SE注意力机制

下载: 全尺寸图片幻灯片

图 6 改进后C3的结构

下载: 全尺寸图片幻灯片

图 7 实验装置及示意图

下载: 全尺寸图片幻灯片

图 8 部分实际检测效果对比

下载: 全尺寸图片幻灯片

图 9 融合SE注意力机制和改进SE注意力机制特征图对比

下载: 全尺寸图片幻灯片

表 1 YOLOv5模型融合SE注意力机制前后的检测指标对比

模型(Models)	Precision	Recall	mAP@0.5
YOLOv5	0.832	0.911	0.949
YOLOv5-SE	0.917	0.929	0.921
YOLOv5-改进SE	0.922	0.938	0.939

下载: 导出CSV

表 2 消融实验各项指标对比

增加检测层	改进SE注意力模块	准确率	召回率	平均精度 mAP@0.5
-	-	0.832	0.911	0.949
√	-	0.906	0.942	0.960
-	√	0.922	0.938	0.939
√	√	0.980	0.973	0.983

下载: 导出CSV

表 3 Faster RCNN，YOLOv3-SPP，YOLOv5，改进YOLOv5模型性能比较

模型(Models)	Size(pixels)	Precision	Recall	FPS(帧/s)	Model size(MB)
Faster RCNN	640	0.492	0.926	6.6	193.2
YOLOv3-SPP	640	0.813	0.869	54	323
YOLOv5	640	0.832	0.911	125	3.4
改进YOLOv5	640	0.980	0.973	111	4.6

下载: 导出CSV

[1]	ARIVAZHAGAN S, SHEBIAH R N, SUDHARSAN H, et al. External and Internal Defect Detection of Egg Using Machine Vision[J]. Journal of Emerging Trends in Computing and Informatior Science, 2013, 4(3): 257-261.
[2]	邓海霞, 刘友明, 文友先, 等. 基于机器视觉群体鸡蛋尺寸的检测方法[J]. 华中农业大学学报, 2006, 25(4): 452-454. doi: 10.3321/j.issn:1000-2421.2006.04.027
[3]	潘磊庆, 屠康, 刘鹏, 等. 影响鸡蛋声学响应因素的分析研究[C]//第八届中国蛋品科技大会论文集. 2009: 516-522.
[4]	马卫东, 于亚萍, 张樱飘, 等. 一种声音信号判断鸡蛋裂缝系统设计[J]. 机电工程技术, 2020, 49(11): 53-54, 118. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JXKF202011015.htm
[5]	贺静, 王树才. 基于DSP实时图像分割算法的鸡蛋蛋壳破损检测[J]. 湖南科技学院学报, 2010, 31(4): 55-58, 82. doi: 10.3969/j.issn.1673-2219.2010.04.016
[6]	王树才, 任奕林, 陈红, 等. 利用敲击声音信号进行禽蛋破损检测和模糊识别[J]. 农业工程学报, 2004, 20(4): 130-133. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-NYGU200404029.htm
[7]	邓颖, 吴华瑞, 孙想. 基于机器视觉和穿戴式设备感知的村镇老年人跌倒监测方法[J]. 西南大学学报(自然科学版), 2021, 43(11): 186-194. doi: 10.13718/j.cnki.xdzk.2021.11.021
[8]	杜文飞, 李春光, 万四海. 管道漏磁检测的智能方法综述[J]. 西南师范大学学报(自然科学版), 2022, 47(6): 1-7. doi: http://xbgjxt.swu.edu.cn/article/doi/10.13718/j.cnki.xsxb.2022.06.001
[9]	涂伟沪, 蔡玲霞, 李学军. 基于改进蝗虫算法优化Canny算子的鸡蛋裂纹图像检测[J]. 食品与机械, 2022, 38(2): 167-172, 202. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-SPJX202202028.htm
[10]	赵祚喜, 罗阳帆, 黄杏彪, 等. 基于机器视觉和YOLOv4的破损鸡蛋在线检测研究[J]. 现代农业装备, 2022, 43(1): 8-16. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-GDLJ202201002.htm
[11]	汤青萍, 常玲玲, 卜柱, 等. 鸽蛋壳的物理性状检测及超微结构观察与分析[J]. 青岛农业大学学报(自然科学版), 2019, 36(1): 41-44, 74. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-LYXI201901008.htm
[12]	万卓, 叶明, 刘凯. 基于改进YOLOv4的电机端盖缺陷检测[J]. 计算机系统应用, 2021, 30(3): 79-87. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-XTYY202103010.htm
[13]	HU J, SHEN L, ALBANIE S, et al. Squeeze-and-Excitation Networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2020, 42(8): 2011-2023.
[14]	REDMON J, DIVVALA S, GIRSHICK R, et al. You only Look Once: Unified, Real-Time Object Detection[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). June 27-30, 2016, Las Vegas, NV, USA. IEEE, 2016: 779-788.
[15]	REN S Q, HE K M, GIRSHICK R, et al. Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(6): 1137-1149.
[16]	DONG S, MA Y H, LI C M. Implementation of Detection System of Grassland Degradation Indicator Grass Species Based on YOLOv3-SPP Algorithm[J]. Journal of Physics: Conference Series, 2021, 1738(1): 012051.
[17]	WANG C Y, MARK LIAO H Y, WU Y H, et al. CSPNet: a New Backbone that can Enhance Learning Capability of CNN[C]//2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW). June 14-19, 2020, Seattle, WA, USA. IEEE, 2020: 1571-1580.
[18]	LIN T Y, DOLLÁR P, GIRSHICK R, et al. Feature Pyramid Networks for Object Detection[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). July 21-26, 2017, Honolulu, HI, USA. IEEE, 2017: 936-944.
[19]	LIU S, QI L, QIN H F, et al. Path Aggregation Network for Instance Segmentation[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. June 18-23, 2018, Salt Lake City, UT, USA. IEEE, 2018: 8759-8768.
[20]	周飞燕, 金林鹏, 董军. 卷积神经网络研究综述[J]. 计算机学报, 2017, 40(6): 1229-1251. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JSJX201706001.htm
[21]	ZAKI P W, HASHEM A M, FAHIM E A, et al. A Novel Sigmoid Function Approximation Suitable for Neural Networks on FPGA[C]//2019 15th International Computer Engineering Conference (ICENCO). December 29-30, 2019, Cairo, Egypt. IEEE, 2020: 95-99.
[22]	MERCIONI M A, HOLBAN S. Soft-Clipping Swish: a Novel Activation Function for Deep Learning[C]//2021 IEEE 15th International Symposium on Applied Computational Intelligence and Informatics (SACI). May 19-21, 2021, Timisoara, Romania. IEEE, 2021: 225-230.
[23]	RAMACHANDRAN P, ZOPH B, LE Q V. Searching for Activation Functions[EB/OL]. 2017: arXiv: 1710. 05941. https://arxiv.org/abs/1710.05941.
[24]	HOWARD A, SANDLER M, CHEN B, et al. Searching for MobileNetV3[C]//2019 IEEE/CVF International Conference on Computer Vision (ICCV). October 27-November 2, 2019, Seoul, Korea (South). IEEE, 2020: 1314-1324.
[25]	GAO S, WU J M, DA C, et al. SATB-Nets: Training Deep Neural Networks with Segmented Asymmetric Ternary and Binary Weights[C]//International Conference on Neural Information Processing. Cham: Springer, 2018: 700-710.
[26]	HENDRYCKS D, GIMPEL K. Bridging Nonlinearities and Stochastic Regularizers with Gaussian Error Linear Units[J]. CoRR, 2016, abs/1606. 08415: 1-10.

图( 9) 表( 3)

计量

文章访问数: 4421
HTML全文浏览数: 4421
PDF下载数: 215
施引文献: 0

全文HTML

在禽蛋经营中，破损禽蛋分拣是一个非常重要的环节. 为解决传统人工分拣准确度低、漏检率高、速度慢的问题，提高自动分拣的水平，研究人员一直在研究采用先进技术来实现禽蛋破损自动检测. 在过去的20年里，有不少专家学者将传统的机器视觉^[1-2]和音频分析^[3-4]等各种技术手段应用在禽蛋破损检测上. 贺静等^[5]提出的基于DSP实时图像采集处理的鸡蛋破损检测方法，将DSP实时采集的鸡蛋图片灰度化处理后，应用外接矩形法描绘鸡蛋近似椭圆投影的外切矩形，利用改进型标记法判断鸡蛋是否破损. 但该方法有一定的局限性，检测时会受到蛋壳斑点的影响，当斑点面积大于15.04 mm²时，就会错检. 王树才等^[6]根据声波在不同介质中的不同特性，利用敲击声音信号进行研究，发现正常蛋、破损蛋、钢壳蛋和尖嘴蛋在衰减时间、共振峰频率、最大频差3项指标上存在显著差异，据此实现蛋的破损检测. 但该方法受到噪声和敲击点的位置影响较大，对检测精度有一定的影响.

从相关研究文献^[1-6]可以看出，传统机器学习算法应用在禽蛋破损检测时，鲁棒性比较差，容易受到多因素的干扰，漏检和错检问题比较突出，很难满足大规模分拣的需要. 近年来，计算机视觉技术迅猛发展，目标检测算法不断改进和创新，被广泛运用在各个领域中^[7-8]. 在蛋破损检测领域，研究人员也不断尝试将各种目标检测算法应用在研究中，极大地提高了蛋壳破损检测的精度和速度. 如涂伟沪等^[9]利用蝗虫算法(grasshopper optimization algorithm，GOA)改进canny算子，提高了鸡蛋线型、网状裂纹的检测精度，对鸡蛋的线型和网状裂纹的漏检率分别降低了20%以上和60%以上；赵祚喜等^[10]用YOLOv4进行了鸡蛋破损的在线检测研究，破损蛋的识别率达85%左右.

相比于鸡、鸭、鹅等禽蛋，鸽子蛋具有体积更小、蛋壳更易碎的特点. 据汤青萍等^[11]人研究，鸽子蛋壳平均厚度为0.23 mm，蛋壳强度1.19 kg/cm，乳突层稀疏、形状不规则且直径较大，栅栏层断面凹凸不平，晶体层晶体排列松散、晶格棱角模糊. 基于此，本文实验采用目前综合性能最优的目标检测算法YOLOv5来研究鸽子蛋壳破损检测. 以自行设计的设备分别对裂纹鸽蛋和完好鸽蛋的图像进行采集，对数据通过Mosaic数据增强^[12]、自适应锚框计算、自适应图片缩放等进行预处理. 在实验过程中，出现了模型对部分裂纹鸽蛋识别准确率不高的问题，原因在于细微裂纹在深层网络中出现特征丢失、气室特征权重过高的问题，干扰了裂纹特征的提取. 为此，本研究对YOLOv5模型进行了相应的改进，增加一个检测层以提高对细微裂纹特征的提取能力，融合改进的SE注意力机制(squeeze-and-excite)^[13]以提高裂纹特征的权重. 本文采用YOLOv5^[14]，Faster RCNN^[15]，YOLOv3-SPP^[16]进行对比，结果显示，本文改进的YOLOv5模型在鸽蛋破损检测中综合优势明显，为鸽蛋的破损检测提供了新的解决方案.

5. 结论

本研究实验针对鸽蛋破损的检测任务，提出了一种基于改进YOLOv5的裂纹检测方法，通过数据增强扩大数据集、增加检测层、在主干网络中添加注意力机制并对注意力机制的全局平均池化层和全连接层进行改进，有效提高了裂纹鸽蛋的检测准确率.

实验结果表明，本次实验构建的基于改进YOLOv5的裂纹鸽蛋的分拣识别模型整体性能优于Faster RCNN、YOLOv3-SPP，对于裂纹鸽蛋的识别准确率高、速度快. 在检测设备上进行检测时，模型对鸽子蛋壳裂纹的检测精度达到了98%，召回率达到了97.3%，对单张图片的检测速度在0.09 s以内，开发板环境下可在帧数约30 FPs的实时检测中流畅地运行. 该实验模型已经可以满足企业在鸽子蛋品质分拣上的应用. 并且模型大小仅为4.6 Mb，可搭载在开发板、移动设备等轻量级的设备上，是一个能够大规模部署的轻量级模型，可以为搭建鸽子蛋品质检测流水线提供良好的技术支撑.

参考文献 (26)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

留言板

基于改进YOLOv5的鸽子蛋壳破损检测

仲恺农业工程学院信息科学与技术学院/广东省食品安全溯源与控制工程技术研究中心，广州 510225

作者简介:
杨航，硕士研究生，主要从事人工智能研究 .

通讯作者: 邹娟，讲师，硕士研究生导师;

Detection of Pigeon Eggshell Breakage Based on Improved YOLOv5

School of Information Science and Technology, Zhongkai University of Agriculture and Engineering/Guangdong Provincial Food Safety Traceability and Control Engineering Technology Research Center, Guangzhou 510225, China

计量

基于改进YOLOv5的鸽子蛋壳破损检测

通讯作者: 邹娟，讲师，硕士研究生导师;

作者简介: 杨航，硕士研究生，主要从事人工智能研究
仲恺农业工程学院信息科学与技术学院/广东省食品安全溯源与控制工程技术研究中心，广州 510225

English Abstract

Detection of Pigeon Eggshell Breakage Based on Improved YOLOv5

Corresponding author: ZOU Juan ;

全文HTML

1.1. YOLOv5算法描述

1.1.1. 输入端

1.1.2. 主干网络

1.1.3. 颈部网络

1.1.4. 输出端

1.2. 算法优化

1.2.1. 增加检测层

1.2.2. 添加注意力机制SE模块

2.1. 实验设备

2.2. 数据采集和数据集建立

2.3. 训练环境以及模型训练

3.1. 融合SE注意力机制前后对比

3.2. 消融实验

3.3. 不同模型检测效果比较

目录

留言板

基于改进YOLOv5的鸽子蛋壳破损检测

仲恺农业工程学院 信息科学与技术学院/广东省食品安全溯源与控制工程技术研究中心，广州 510225

作者简介: 杨航，硕士研究生，主要从事人工智能研究 .

通讯作者: 邹娟，讲师，硕士研究生导师;

Detection of Pigeon Eggshell Breakage Based on Improved YOLOv5

School of Information Science and Technology, Zhongkai University of Agriculture and Engineering/Guangdong Provincial Food Safety Traceability and Control Engineering Technology Research Center, Guangzhou 510225, China

计量

出版历程

基于改进YOLOv5的鸽子蛋壳破损检测

通讯作者: 邹娟，讲师，硕士研究生导师;

作者简介: 杨航，硕士研究生，主要从事人工智能研究 仲恺农业工程学院 信息科学与技术学院/广东省食品安全溯源与控制工程技术研究中心，广州 510225

English Abstract

Detection of Pigeon Eggshell Breakage Based on Improved YOLOv5

Corresponding author: ZOU Juan ;

全文HTML

1.1. YOLOv5算法描述

1.1.1. 输入端

1.1.2. 主干网络

1.1.3. 颈部网络

1.1.4. 输出端

1.2. 算法优化

1.2.1. 增加检测层

1.2.2. 添加注意力机制SE模块

2.1. 实验设备

2.2. 数据采集和数据集建立

2.3. 训练环境以及模型训练

3.1. 融合SE注意力机制前后对比

3.2. 消融实验

3.3. 不同模型检测效果比较

目录

仲恺农业工程学院信息科学与技术学院/广东省食品安全溯源与控制工程技术研究中心，广州 510225

作者简介:
杨航，硕士研究生，主要从事人工智能研究 .

作者简介: 杨航，硕士研究生，主要从事人工智能研究
仲恺农业工程学院信息科学与技术学院/广东省食品安全溯源与控制工程技术研究中心，广州 510225