基于改进型EfficientNet模型的木薯病害识别方法研究

曾姣艳; 林思涛; 谢亚君; 曾美艳

doi:10.13718/j.cnki.xdzk.2024.06.017

基于改进型EfficientNet模型的木薯病害识别方法研究

1.
福州外语外贸学院大数据学院，福州 350202

2.
数据科学与智能计算重点实验室，福州 350202

3.
郴州职业技术学院商贸旅游学院，湖南郴州 423000

基金项目: 国家自然科学基金项目(12371378)；福建省自然科学基金项目(2022J01378)

详细信息

作者简介:
曾姣艳，硕士，副教授，主要从事数据挖掘和机器学习研究 .

通信作者: 谢亚君，教授;

中图分类号: TP391

Research on Cassava Disease Recognition Methods Based on Improved EfficientNet Model

1.
Big Data Institute, Fuzhou University of International Studies and Trade, Fuzhou 350202, China

2.
Key Laboratory of Data Science and Intelligent Computing, Fuzhou 350202, China

3.
School of Commerce & Tourism, Chenzhou Vocational Technical College, Chenzhou Hunan 423000, China

摘要:
为实现木薯病害图像的快速、准确识别，提出一种基于EfficientNet模型的木薯病害识别方法. 首先针对输入样本的分布不平衡问题，通过Mixup、CutMix及GridMask这3种数据增强方法对数据进行增强，数据增强后由EfficientNet-B4模型提取特征，然后引入warmup结合余弦退火优化学习率防止模型在初期发生过拟合及后期收敛速度慢的情况. 实验结果表明，所采用模型相较于近年来主流的VGG16及ResNet101模型不仅参数量远小于两者，在木薯病害图像分类上的表现也优于两者，且其计算量更少，模型精度更高，训练速度更快，符合实际应用的要求. EfficientNet模型在木薯病害数据上的分类准确率可达90%.
- 木薯病害图像 /
- 数据增强 /
- EfficientNet模型 /
- 余弦退火
Abstract:
An EfficientNet model based cassava disease recognition method was proposed for fast and accurate recognition of cassava disease images. The method first addressed the imbalance in the distribution of the input samples, performed the data enhancement by three data enhancement methods of Mixup, CutMix and GridMask. The feature was extracted by EfficientNet-B4 model after data enhancement, then warmup combined with cosine annealing learning rate was introduced to prevent the model from overfitting at early stage and slow convergence speed at late stage. The experimental results show that compared with the mainstream VGG16 and ResNet101 models in recent years, the model used in this paper not only has a much smaller number of parameters than the two models, but also has a better performance on classification of cassava leaf disease image than that of two models. It is less computationally intensive, with higher model accuracy and faster training, which meets the requirements of practical applications. EfficientNet model can achieve 90% classification accuracy on cassava leaf disease data.
- cassava disease images /
- data enhancement /
- EfficientNet model /
- cosine annealing .

图 1 图像样本分布情况

下载: 全尺寸图片幻灯片

图 2 Mixup处理结果

下载: 全尺寸图片幻灯片

图 3 CutMix处理结果

下载: 全尺寸图片幻灯片

图 4 二值掩膜

下载: 全尺寸图片幻灯片

图 5 Gridmask处理结果

下载: 全尺寸图片幻灯片

图 6 迁移学习过程

下载: 全尺寸图片幻灯片

图 7 学习率变化曲线

下载: 全尺寸图片幻灯片

图 8 准确率曲线与损失率曲线

下载: 全尺寸图片幻灯片

图 9 模型混淆矩阵

下载: 全尺寸图片幻灯片

表 1 EfficientNet-B0网络参数结构

阶段	卷积操作	分辨率	通道	层数
1	Conv 3×3	224×224	32	1
2	MBconv1，k3×3	112×112	16	1
3	MBconv6，k3×3	112×112	24	2
4	MBconv6，k5×5	56×56	40	2
5	MBconv6，k3×3	28×28	80	3
6	MBconv6，k5×5	14×14	112	3
7	MBconv6，k5×5	14×14	192	4
8	MBconv6，k3×3	7×7	320	4
9	Conv×1&pooling&FC	7×7	1 280	1

下载: 导出CSV

表 2 EfficientNet-B4参数配置

层(类型)	输出形状	参数
Efficientnetb4	(None，16，16，1792)	17 673 816
dropout	(None，16，16，1792)	0
global_average_pooling2d	(None，1792)	0
dropout_1	(None，1792)	0
dense	(None，5)	8 965

下载: 导出CSV

表 3 模型对各类样本的分类性能

病例	精确率/%	召回率/%	F1-Score/%	样本量	平均F1-Score/%
CBB	69	74	71	246	90
CBSD	88	85	86	604
CGM	85	81	83	526
CMD	96	98	97	2591
健康叶片	80	76	78	481

下载: 导出CSV

表 4 不同模型分类准确率

模型	识别准确率/%		参数量
模型	测试集	验证集	参数量
VGG16	79.64	82.33	1.38×10⁸
ResNet101	83.77	84.44	4.45×10⁷
EfficientNet-B4	89.51	90.70	1.9×10⁷

下载: 导出CSV

[1]	付海天, 郑华, 文峰, 等. 中国木薯研究及产业发展趋势[J]. 农业研究与应用, 2022, 35(4): 9-22. doi: 10.3969/j.issn.2095-0764.2022.04.003
[2]	刘琳玉, 赵平娟, 符艳等. 木薯花叶病毒AC4蛋白与AtPARN互作研究[J/OL]. 热带作物学报, 2024, 45(1): 197-204.
[3]	PICON A, SEITZ M, ALVAREZ-GILA A, et al. Crop Conditional Convolutional Neural Networks for Massive Multi-Crop Plant Disease Classification over Cell Phone Acquired Images Taken on Real Field Conditions[J]. Computers and Electronics in Agriculture, 2019, 131(11): 356-366.
[4]	XIAO M H, MA Y, FENG Z X, et al. Rice Blast Recognition Based on Principal Component Analysis and Neural Network[J]. Computers and Electronics in Agriculture, 2018, 12(10): 482-490.
[5]	FUENTES A, YOON S, KIM S C, et al. A Robust Deep-Learning-Based Detector for Real-Time Tomato Plant Diseases and Pests Recognition[J]. Sensors, 2017, 17(9): 87-108.
[6]	顾博, 邓蕾蕾, 李巍, 等. 基于GrabCut算法的玉米病害图像识别方法研究[J]. 中国农机化学报, 2019, 40(11): 143-149. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-GLJH201911024.htm
[7]	张善文, 谢泽奇, 张晴晴. 卷积神经网络在黄瓜叶部病害识别中的应用[J]. 江苏农业学报, 2018, 34(1): 56-61. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JSNB201801009.htm
[8]	方晨晨, 石繁槐. 基于改进深度残差网络的番茄病害图像识别[J]. 计算机应用, 2020, 40(S1): 203-208. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JSJY2020S1041.htm
[9]	熊梦园, 詹炜, 桂连友, 等. 基于ResNet模型的玉米叶片病害检测与识别[J]. 江苏农业科学, 2023, 51(8): 164-170. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JSNY202308024.htm
[10]	宋玲, 曹勉, 胡小春, 等. 基于YOLOX的复杂背景下木薯叶病害检测方法[J]. 农业机械学报, 2023, 54(3): 301-307. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-NYJX202303030.htm
[11]	ZHANG H Y, CISSE M, DAUPHIN Y N, et al. Mixup: Beyond Empirical Risk Minimization[EB/OL]. (2018-04-27)[2023-04-01]. https://arxiv.org/pdf/1710.09412v2.
[12]	YUN S, HAN D, CHUN S, et al. CutMix: Regularization Strategy to Train Strong Classifiers with Localizable Features[C] //2019 IEEE/CVF International Conference on Computer Vision (ICCV). Seoul: IEEE, 2019.
[13]	CHEN P G, LIU S, ZHAO H S, et al. GridMask Data Augmentation[EB/OL]. (2020-01-14)[2023-04-01]. https://arxiv.org/pdf/2001.04086v2.
[14]	XIE S N, GIRSHICK R, DOLLÁR P, et al. Aggregated Residual Transformations for Deep Neural Networks[C] //2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Honolulu: IEEE, 2017.
[15]	HE K M, ZHANG X Y, REN S Q, et al. Identity Mappings in Deep Residual Networks[M] //LEIBE B, MATAS J, SEBE N, et al. Computer Vision-ECCV 2016. Cham: Springer International Publishing, 2016.
[16]	ZAGOURUYKO S, KOMODAKIS N. Wide Residual Networks[EB/OL]. (2017-06-14)[2023-04-01]. https://arxiv.org/pdf/1605.07146.
[17]	HOWARD A G, ZHU M L, CHEN B, et al. MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications[EB/OL]. (2017-04-17)[2023-04-01]. https://arxiv.org/pdf/1704.04861.
[18]	Tan M, Le Q. Efficientnet: Rethinking Model Scaling for Convolutional Neural Networks[C]. Sacramento: International Conference on Machine Learning, 2019.
[19]	SARKAR C, GUPTA D, GUPTA U, et al. Leaf Disease Detection Using Machine Learning and Deep Learning: Review and Challenges[J]. Applied Soft Computing, 2023, 145: 110534.

图( 9) 表( 4)

计量

文章访问数: 2288
HTML全文浏览数: 2288
PDF下载数: 326
施引文献: 0

全文HTML

开放科学(资源服务)标识码(OSID):
木薯是热带地区的重要经济作物之一，由于其具有耐旱耐贫等特性，在世界范围内被广泛种植. 木薯是一种重要的粮食作物，尤其在一些发展中国家是主要的食物来源之一，但它易受各种病害的侵袭^[1]，其中细菌性枯萎病(CBB)、褐条病(CBSD)、花叶病(CMD)、绿螨病(CGM)等多种病害严重影响了木薯的质量和产量. 木薯叶是进行光合作用及蒸腾作用的主要场所，叶片面积是影响木薯生长的一个重要因素，它直接影响木薯的产量. 叶片面积越大，光合作用效率越高，蒸腾作用也越强，从而促进植株生长发育，提高木薯产量. 叶片面积还会影响木薯的耐旱性、耐寒性、抗病虫害能力及抗高温性能. 因此，想要获得更好的木薯产量，就必须保证植株叶片面积合理. 然而，木薯生长期间面临各种病害的威胁，其中最严重的病害之一就是花叶病^[2]，这种病害会导致木薯叶片产生凹陷、脱落，最终影响植株的生长和产量. 木薯叶病害识别的意义不仅在于保障农业产量、维护食品安全、降低经济损失、维护生态平衡，同时也为科学研究和技术创新提供了重要的基础. 因此，研究木薯叶片病害的早期检测和预防方法至关重要.

国内外学者将深度学习技术引入农作物病害识别已有较长时间. 近年来，通过采用深度学习技术自动识别农作物病害受到越来越多学者的关注. 在国外，Picon等^[3]利用移动设备获取多种作物图像数据集，提出3种不同的卷积神经网络架构实现了多种农作物病害识别. Xiao等^[4]利用主成分分析和BP神经网络算法对稻瘟病进行识别，实验数据表明提出的方法能够快速准确地识别稻瘟病株. Fuentes等^[5]提出了一种基于深度学习的多种病虫害检测方法. 在国内，顾博等^[6]结合SLIC算法和GrabCut自动分割算法较好地分割出了玉米小斑病、大斑病和灰斑病. 张善文等^[7]运用LeNet模型进行黄瓜病害识别，并对1 200幅黄瓜病害图像进行预处理，调整RGB颜色通道，实验结果表明其方法高于传统方法，达到了较高精度. 方晨晨等^[8]提出一种基于深度ResNet网络的方法对番茄病害图像进行分类，该方法不仅减小了数据存储容量，同时提高了算法精度. 熊梦园等^[9]提出一种ResNet50结合CBAM注意力机制模型的方法对玉米枯萎叶、锈病叶、灰斑病叶和健康叶进行精准检测，相比ResNet50模型准确率提升了4.2个百分点. 宋玲等^[10]提出的CDD模型是一种基于改进YOLOX网络的木薯叶病害检测模型，对田间木薯叶病害具有更强的检测能力，在不增加参数量的情况下提高了检测分类的精确率.

上述方法在对病害图像进行识别时往往通过改变网络模型的深度、宽度和分辨率优化性能，可能会造成模型过拟合，从而导致模型识别效率降低. 为此，本文以木薯细菌性枯萎病(CBB)、褐条病(CBSD)、花叶病(CMD)、绿螨病(CGM)这4种常见病害及健康叶片为研究对象，提出一种基于EfficientNet模型的木薯病害识别方法，以期实现木薯病害的快速、准确识别.

2. 模型训练

2.1. 实验环境

实验主要在Kaggle提供的张量处理单元(TPU)环境中进行，可以极大地提升模型训练速度，Python版本为3.7.9，采用Tensorflow 2.4.0深度学习框架.

EfficientNet-B4参数的选择对于模型效率和准确率具有重要影响，合理地选择参数可使模型不会过分地占用和消耗资源，从而使模型效率和准确率降低. 本文采用的EfficientNet-B4运行参数配置如表 2所示. 模型迭代次数为30，批次大小为16，初始学习率为1×10^-6，利用余弦退火衰减方法优化学习率，选用Adam作为优化器.

2.2. 评价指标

2.2.1. 准确率

在常用的模型评价指标中，准确率的采用最为广泛. 在机器学习中，其定义为预测准确的样本数占全部样本的百分比. 对于二分类模型，准确率的数学定义为：

式(7)中，TP表示实际正样本被预测为正样本的数量，FP表示实际负样本被预测为正样本的数量；TN表示实际正样本被预测为负样本的数量，FN表示实际负样本被预测为负样本的数量.

在样本种类数量分布均匀的数据集中，准确率能对网络的综合性能做出评价. 但是，实际数据集不同种类样本数量经常极不平衡，这在木薯病害图像数据中体现得十分明显. 木薯不同病害的患病概率往往不同，造成采集到的图像样本数量差异较大. 采用准确率作为评价指标或将稀释模型运用于小样本学习中与真实结果会发生较大的偏差，因此本文使用精确率及召回率作为评价网络性能的指标.

2.2.2. 精确率和召回率

1)以二分类模型为例，精确率定义为全部预测结果为正样本的样本里，预测正确所占的百分比，其数学定义为：

式(8)可理解为针对被预测的某类样本进行计算，得到该类别中出现预测错误的概率.

2) 以二分类模型为例，召回率定义为正样本中预测结果为正样本的占比，其数学定义为：

式(9)可理解为某类别样本被预测正确的比例，适用一个数据集中对小样本的预测性能进行评价.

由精确率和召回率定义可知，在分类模型中两者往往相互矛盾. 当召回率提高时，精确率往往会降低，反之亦然. 为了能够更好地综合评价网络性能，本文引入F1-Score评价指标，其数学定义为：

F1-Score结合了精确率和召回率，可较好地反映网络的预测性能.

4. 结论

本文以木薯病害图像数据集为研究对象，运用图像处理与深度学习技术提出一种基于EfficientNet-B4的木薯病害识别模型. 为减小数据集中样本分布不均衡的影响，增强模型的泛化能力，本文选择MixUp、CutMix和Gridmask这3种数据增强技术，并引入WarmUp结合余弦退火方法优化学习率，防止模型出现训练初期陷入过拟合以及训练后期收敛慢的情况. 与近年来流行的深度学习模型相比，本文提出的模型具有参数量少、准确率高等优点.

参考文献 (19)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

留言板

基于改进型EfficientNet模型的木薯病害识别方法研究

1.
福州外语外贸学院大数据学院，福州 350202

2.
数据科学与智能计算重点实验室，福州 350202

3.
郴州职业技术学院商贸旅游学院，湖南郴州 423000

作者简介:
曾姣艳，硕士，副教授，主要从事数据挖掘和机器学习研究 .

通信作者: 谢亚君，教授;

Research on Cassava Disease Recognition Methods Based on Improved EfficientNet Model

1.
Big Data Institute, Fuzhou University of International Studies and Trade, Fuzhou 350202, China

2.
Key Laboratory of Data Science and Intelligent Computing, Fuzhou 350202, China

3.
School of Commerce & Tourism, Chenzhou Vocational Technical College, Chenzhou Hunan 423000, China

计量

基于改进型EfficientNet模型的木薯病害识别方法研究

通信作者: 谢亚君，教授;

作者简介: 曾姣艳，硕士，副教授，主要从事数据挖掘和机器学习研究
1. 福州外语外贸学院大数据学院，福州 350202

2. 数据科学与智能计算重点实验室，福州 350202

3. 郴州职业技术学院商贸旅游学院，湖南郴州 423000

English Abstract