-
开放科学(资源服务)标识码(OSID):

-
近年来,随着深度学习技术的兴起,视觉领域的研究被广泛应用到图像识别模型中[1]。图像识别技术能够快速、准确地识别病虫害类型,相较于传统的人工识别方法,其效率更高且误差更小[2]。依托图像识别模型对农作物病虫害进行诊断,可显著提升农业生产的精准化水平。例如,卷积神经网络(CNN)和AlexNet等深度学习算法可以自动提取图像中的特征并进行分类,从而实现对病虫害的精准识别。通过精准识别病虫害,农民可以及时采取防治措施,减少农药的使用量,降低对环境的污染[3]。烟草靶斑病是一种由真菌引起的烟草叶部病害,病原菌为瓜亡革菌(Rhizoctonia solani Kühn)[4],在烟草生长过程中具有较高危害性,严重威胁烟叶产量与质量。该病害症状在烟草各生长阶段均可显现,主要侵染叶片,偶见危害茎部[5]。凭借人工经验判别靶斑病易引入主观误差,而传统检测手段依赖生化鉴定与鉴别培养基,流程冗长、效率较低。因此,构建图像识别模型对烟草靶斑病进行智能识别,可在提高准确率的同时,显著降低判断成本。
然而,在图像识别模型研究过程中,数据不足与数据样式单一化问题常导致识别模型性能欠佳。为此,研究者提出采用数据增强技术来弥补图像数据劣势。数据增强(Data Augmentation)是一种通过对现有图像数据进行变换和处理,生成更多训练样本的技术,其主要目的是增加数据集的多样性和数量,从而提升模型的泛化能力和鲁棒性[6]。该技术在农业病虫害识别领域已得到广泛应用。例如,采用图像翻转、亮度调整等技术对带有烟蚜的烟叶图像进行数据增强,显著提升了ResNet101模型的识别准确率[7]。在棉花作物病害检测中,定制深度学习模型耦合数据增强技术,同样实现了检测精度的跃升。在茶叶病害识别研究中,改进的生成对抗网络用于数据增强,生成新样本后,VGG16模型的鲁棒性与识别准确率均得到显著提升 [8]。基于此,本研究拟采用图像数据增强技术,围绕烟草靶斑病不同发病症状图像进行多样化扩增,以期提升烟草靶斑病病害识别模型的性能。
HTML
-
试验区位于重庆植烟区,图像采集时间为2024年5月至9月(烟草大田生育期)。在田间选取具有典型烟草靶斑病症状的烟叶样本,使用不同品牌手机进行拍摄,模拟实际使用中用户多样化特性。拍摄者持手机在距离烟叶20 cm处进行拍摄,拍摄过程中采用原相机,不开闪光灯,不进行焦距缩放,确保图像的自然背景与烟草实际生长条件高度相符。
-
对采集图像进行预处理以提高图像质量,包括去除模糊的低质量图像并统一标注格式,借助专业标注工具精确标注病斑区域和病害等级,病害等级标注参考《烟草有害生物的调查与测报》,同时采取数据增强手段对图像数据进行扩充。在烟草靶斑病初期,可见直径2~3 mm的小型圆形水渍状斑点。在适宜的环境条件下,这些微小坏死斑点会迅速扩展,最终发展为直径约5 cm、具有明显同心环状特征的大面积病斑。参考既有研究结果及病害防治策略,将烟草靶斑病损害程度分为3个等级。1级:叶片上出现局部零星斑点(0<面积占比≤20%);2级:叶片出现穿孔或多处斑点(20%<面积占比≤40%);3级:叶片大面积穿孔、叶片皱缩及变形(面积占比>40%)[9]。图 1为烟草靶斑病病害严重程度分级示意图。
-
本研究采用的第一种数据增强方法为图像变换,包括旋转、反射、缩放、移动、翻转和裁剪等。这些变换可以有效克服训练数据中存在的位置偏差[10]。此外,针对烟草靶斑病不同病害等级的图像,进一步采用色彩通道空间进行数据增强,改变图像亮度值,增强或减弱图像的对比度、灰度、色彩等。
-
混合增强(Mixed Sample Data Augmentation,MSDA)的核心是通过混合不同样本生成更丰富的训练数据,旨在提升模型对未见样本的泛化能力,提高模型的鲁棒性[11]。具体流程为:首先对每个靶斑病图像样本进行随机裁剪、随机旋转、颜色扰动等,得到增强后的样本;然后,将增强后的样本按照不同比例混合,形成一个新的训练批次[12],以提升模型对于不同输入的适应能力。本研究采用2种混合增强方法处理烟草靶斑病图像,分别为MixUp和CutMix,前者通过线性插值混合图像的像素值和标签生成新的样本;后者从图像的空间角度考虑,将烟草靶斑病图片上的某个随机矩形区域剪裁并粘贴到另一张图片,生成新样本[13]。
-
烟草靶斑病图像识别模型在Win11X64操作系统下开发,采用深度学习开源框架Pytorch。计算机运行内存为32 GB,搭载13thGenIntel(R)Core(TM)i7-13900H 2.60GHz处理器,支持GPU加速和动态神经网络,搭载英伟达RTX 3060 Ti显卡[14]。
对烟草靶斑病图像识别模型进行性能测试,评估指标为训练集准确率、测试集准确率、训练集损失值和测试集损失值。数据集划分为训练集、测试集及验证集,比例为6∶3∶ 1。对3种主流图像识别模型AlexNet、GoogleNet和ResNet101分别进行不采用数据增强的图像训练和采用数据增强的图像训练。每种模型进行30次迭代。模型训练均采用Adam优化器与StepLR调度器,学习率设置0.01。保证不同模型除去数据增强操作外没有训练参数改变。评估良好的模型通常认为具有更高的准确率和更低的损失值[15-17]。
1.1. 数据采集
1.2. 图像预处理
1.3. 数据增强
1.3.1. 变换增强
1.3.2. 混合增强
1.4. 模型测试
-
本研究共采集烟草图像2 752张,筛选后保留有效图像2 317张,按病害等级分为4级:0级:健康烟草,共537张;1级:轻度发病,共588张;2级:中度发病,共626张;3级:重度发病,共566张。
采用两种数据增强方法(变换增强与混合增强)将图像扩充至4 000张。变换增强效果如图 2所示,混合增强效果如图 3所示。
为评估数据增强对模型性能的提升效果,采用基线模型ResNet50对图像进行识别,将未采用数据增强和采用数据增强方式训练得出的结果进行比对,结果见表 1。由表 1可知,引入图像变换后,模型在测试集上的准确率立刻提升4.24个百分点,且训练集与测试集损失同步下降,证明其有效抑制了过拟合;与采用图像变换处理的图像数据相比,使用混合增强的图像数据测试集准确率提升约2.21个百分点,显示出更强的泛化能力。
-
未采取数据增强技术,3种不同模型(AlexNet、GoogleNet、ResNet101)在训练和测试过程中的损失值和准确率变化情况如图 4所示。不同图像识别模型训练集的损失值都随着训练轮次的增加逐渐下降,表明模型在训练集上的表现持续优化。由图 4a可知,ResNet101的损失下降速度最快,最终损失值最低,表明其在训练集上的表现最好。AlexNet的测试集损失值波动较大,GoogleNet和ResNet101的测试集损失值相对较为平稳;GoogleNet和ResNet101的测试集损失值较低,表明它们在测试集上的表现较好(图 4b)。在准确率方面,3种模型的训练准确率都随着训练轮次的增加而逐渐上升,进一步验证了模型在训练集上的优化效果;ResNet101的训练准确率最高,表明其在训练集上的表现最好(图 4c)。GoogleNet和ResNet101的测试准确率较高,且较为平稳,表现出良好的泛化能力;相比之下,AlexNet的测试准确率波动较大,整体表现不如GoogleNet和ResNet101(图 4d)。
-
采用数据增强技术后,烟草靶斑病图像识别模型的训练情况如图 5所示。由图 5可知,AlexNet、GoogleNet和ResNet101 3种识别模型在训练集和测试集上的损失值较未采用数据增强的模型下降速度降低,同时训练集和测试集准确率较未采用数据增强的模型有所上升,表明数据增强技术有效提升了模型的收敛速度和识别精度。AlexNet模型训练集和测试集的损失值较大,准确率较低,性能与GoogleNet和ResNet101相比较差。由表 2可知,各模型在采用数据增强后的性能提升存在差异。Alexnet模型测试集准确率提升0.75%,GoogleNet模型测试集准确率提升3.06%,ResNet101模型提升0.58%。Alexnet模型的训练集平均准确率提升0.36%,GoogleNet模型的训练集平均准确率提升2.21%,ResNet101模型的训练集平均准确率提升2.19%。Alexnet模型的训练集损失值增加0.141 9,测试集损失值增加0.061 5。GoogleNet模型的训练集损失值降低0.005 6,测试集损失值降低0.043 0。ResNet101模型的训练集损失值降低0.097 0,测试集损失值降低0.026 8。数据增强对不同模型的效果不同。对于GoogleNet模型,数据增强能够显著提升模型的准确率和泛化能力;对于ResNet101模型,数据增强也能在一定程度上提升模型的性能;对于AlexNet模型,数据增强的效果相对其他两个模型有限,提升幅度较小。
-
将采用混合数据增强优化的GoogleNet模型保存后进行仿真测试。测试基于Python Tkinter库开发的图形用户界面(GUI)程序,构建了图像识别的应用界面。该界面专门用于测试不同模型对烟草靶斑病的识别效果,支持疾病图像的上传、展示与预测功能。测试效果见图 6,图中清晰呈现了上传图像后的识别结果与响应时间,直观反映了模型在实际应用中的性能表现。
2.1. 图像结果
2.2. 数据增强前烟草靶斑病图像识别模型训练结果
2.3. 数据增强后烟草靶斑病图像识别模型训练结果
2.4. 烟草靶斑病识别仿真测试
-
本研究通过传统数据增强(图像翻转、灰度调整、亮度调整、色度调整等)与混合增强(MixUp和CutMix)方法,在AlexNet、GoogleNet和ResNet101 3种主流图像识别模型上验证了数据增强对烟草靶斑病识别模型的提升效果。结果表明,数据增强技术显著提升了模型的性能。具体而言,数据增强后,模型的训练集和测试集损失值均显著降低,训练集准确率和测试集准确率最高分别提升了4.98%和2.21%。这表明数据增强技术能够有效增加数据集的多样性和数量,从而提升模型的泛化能力和鲁棒性[18]。
-
尽管数据增强技术对所有模型都产生了积极影响,但不同模型的响应程度存在差异。对于GoogleNet,数据增强显著提升了其准确率和泛化能力,测试集准确率提高了3.06%,训练集损失值降低了0.005 6,测试集损失值降低了0.043 0。对于ResNet101,数据增强也提升了模型性能,测试集准确率提高了0.58%,训练集损失值降低了0.097 0,测试集损失值降低了0.026 8。然而,对于AlexNet,数据增强的效果相对有限,测试集准确率提高了0.75%,训练集损失值甚至略有增加。这种差异可能与模型的结构复杂度和对数据多样性的敏感度有关。GoogleNet和ResNet101具有更复杂的网络结构,能够更好地利用数据增强带来的多样性,而AlexNet结构相对简单,对数据增强的响应不够敏感[19-20]。
-
本研究综合应用变换增强和混合增强方法处理烟草靶斑病图像数据。变换增强通过旋转、反射、缩放、移动、翻转和裁剪等操作,有效克服了训练数据中的位置偏差。同时,通过色彩通道空间调整,增强了图像的亮度、对比度、灰度和色彩[21]。混合增强(如MixUp和CutMix)通过将不同样本混合生成新的训练数据,进一步提高了模型的鲁棒性[22]。然而,不同的数据增强方法对模型性能的提升效果存在差异。CutMix在GoogleNet上表现最优(测试准确率提升3.06%),而MixUp在ResNet101上效果更显著(损失降低0.097 0)。未来可探索生成对抗网络(GAN)等先进技术,进一步丰富数据多样性并提升模型性能[23]。
3.1. 数据增强技术对烟草靶斑病识别模型性能的影响
3.2. 不同模型对数据增强的响应差异
3.3. 数据增强方法的选择与优化
-
本研究通过数据增强技术显著提升了烟草靶斑病图像识别模型的性能,为烟草病害图像识别模型的研究提供了有效的数据处理方法,并为图像识别技术在农业领域的应用提供了科学依据。未来研究应进一步优化数据增强方法,扩大样本采集范围,并探索更先进的数据增强技术,以进一步提升模型的泛化能力和鲁棒性。
DownLoad: