基于Cu-ViT深度学习的烟草气候斑病害分级识别模型的开发应用

金亚波; 孙佳照; 罗锦舟; 吴修淼; 丁伟; 罗建钦

doi:10.13718/j.cnki.zwyx.2025.06.008

基于Cu-ViT深度学习的烟草气候斑病害分级识别模型的开发应用

1.
广西中烟工业有限责任公司, 南宁 400000

2.
西南大学植物保护学院, 重庆 400715

基金项目: 广西中烟工业有限责任公司项目“基于烟叶质量保障的生产技术数字化模型构建”(0633-224042118J00)

详细信息

作者简介:
金亚波，博士，农艺师 .

通讯作者: 罗建钦，高级农艺师

中图分类号: S435.72; TP181

Development and Application of Tobacco Climate Spot Disease Grading Recognition Model Based on Cu -ViT Deep Learning

1.
China Tobacco Guangxi Industrial Co. Ltd., Nanning 530000, China

2.
School of Plant Protection, Southwest University, Chongqing 400715, China

摘要:
对烟草气候斑病害的准确分级识别在农业生产、病害防治和环境保护方面具有多维价值。人工识别存在成本高、主观性强、效率低等问题，可借助图像识别技术解决这一需求。本研究在Vision Transformer(ViT)框架的基础上，将压缩单元(Compression Unit，Cu)替代补丁嵌入，提出Cu-ViT模型，系统地提升了ViT模型对图像捕捉的识别能力。Cu-ViT模型在模拟测试中达到了91.23%的准确率，其F1分数、精确率和召回率均超过了ViT以及ResNet152、InceptionResNetV2、Swin Transformer (SwinT)和VGGNet19等先进识别模型，每张图像的平均识别时间为104.23 ms。此外，Cu-ViT模型在实际生产环境下验证的准确率优于人工识别(p＜0.01)。结果表明，Cu-ViT模型能够对烟草气候斑病害进行分级识别。
- 烟草气候斑病 /
- 病害分级 /
- 图像识别 /
- 深度学习
Abstract:
Accurate grading and identification of tobacco climate spot disease hold multidimensional value in agricultural production, disease control, and environmental protection. Manual identification suffers from issues such as high costs, strong subjectivity, and low efficiency, which can be addressed through image recognition technology. This study, based on the Vision Transformer (ViT) framework, replaces patch embedding with compression units to propose the Cu-ViT model, systematically enhancing the ViT model's capability in image capture and recognition. In simulated tests, the Cu-ViT model achieved an accuracy of 91.23%, with its F1 score, precision, and recall all surpassing those of ViT as well as advanced recognition models such as ResNet152, InceptionResNetV2, Swin Transformer (SwinT) and VGGNet19. The average recognition time per image was 104.23 milliseconds. Furthermore, the Cu-ViT model's accuracy, validated in real production environments, outperformed manual identification (p < 0.01). These results indicate that the Cu-ViT model is capable of grading and identifying tobacco climate spot disease.
- tobacco climate spot disease /
- disease grading /
- image recognition /
- deep learning .

图 1 烟草叶片正常与病害分级图

下载: 全尺寸图片幻灯片

图 2 ViT模型网络结构

下载: 全尺寸图片幻灯片

图 3 Cu-ViT模型网络结构

下载: 全尺寸图片幻灯片

图 4 压缩单元双通道结构

下载: 全尺寸图片幻灯片

图 5 金字塔缩减模块结构

下载: 全尺寸图片幻灯片

图 6 基线模型与Cu-ViT模型混淆矩阵的对比分析

下载: 全尺寸图片幻灯片

图 7 Cu-ViT模型与基线模型的聚焦情况对比

下载: 全尺寸图片幻灯片

图 8 烟草气候斑病害分层识别中不同深度学习模型的训练和验证性能比较

下载: 全尺寸图片幻灯片

图 9 用于识别烟草气候斑病害的模型

下载: 全尺寸图片幻灯片

图 10 Cu-ViT模型识别与人工识别准确率比较

下载: 全尺寸图片幻灯片

表 1 通用模型参数的最优结果

	图像尺寸	批量大小	初始学习率	训练轮数	优化器
通用参数	64×64	32√	0.01√	50	AdamW√
	96×96√	64	0.05	100√	Nadam
	144×144	128	0.1	150	SGD
	224×224	256	0.2	200	Adam
注：√为最优性能选择。

下载: 导出CSV

表 2 消融实验结果

模型/指标	F1分数	召回率	精确率	准确率
基线模型	0.813 4	0.796 1	0.831 4	0.685 2
Cu-ViT模型	0.900 4	0.876 9	0.925 1	0.715 5
提高率/%	10.69	10.15	11.27	4.42

下载: 导出CSV

表 3 不同模型在烟草气候斑病害图像分层识别的平均性能参数

模型/参数	训练损失值	训练准确率	验证损失值	验证准确率	精确率	召回率	F1分数
Cu-ViT	0.221 8	0.923 2	0.311 8	0.935 8	0.925 1	0.876 9	0.900 4
EfficienNetV2	0.782 3	0.638 2	0.653 5	0.722 7	0.712 9	0.701 8	0.707 3
InceptionResNetV2	0.169 2	0.774 9	0.295 4	0.863 1	0.840 6	0.837 9	0.839 2
ResNet152	0.848 8	0.633 3	0.622 9	0.709 4	0.685 7	0.669 2	0.677 3
SwinT	0.690 5	0.711 8	0.501 3	0.806 7	0.789 3	0.775 2	0.782 2
VGGNet19	0.605 7	0.781 3	1.052 7	0.618 6	0.653 1	0.628 7	0.640 7

下载: 导出CSV

表 4 Cu-ViT模型推断出最优参数

类别	参数	符号/键	值/设置
	主干网络	-	Vision-Transformer (ViT-Base)
	卷积层1通道数	C1	64
模型结构	卷积层2通道数	C2	128
	卷积层3通道数	C3	768
	Transformer层	L	12
正则化与初始化	Dropout	pdrop	0.1

下载: 导出CSV

表 5 对烟草气候斑病害不同级别的识别具体准确率

模型/分级	级别0	级别1	级别2	级别3
Cu-ViT模型识别	0.923 1	0.875 4	0.888 1	0.902 5
人工识别	0.967 0	0.829 5	0.754 5	0.817 8

下载: 导出CSV

[1]	孙佳照, 冉渝澳, 冯俊, 等. 西南地区烟草潜在适生区预测[J]. 中国烟草科学, 2023, 44(5): 37-44, 61.
[2]	WANG G L, ZHU Q K, SONG C D, et al. MedKAFormer: When Kolmogorov-Arnold Theorem Meets Vision Transformer for Medical Image Representation[J]. IEEE Journal of Biomedical and Health Informatics, 2025, 29(6): 4303-4313. doi: 10.1109/JBHI.2025.3541982
[3]	WU Y H, LIU Y, ZHAN X, et al. P2T: Pyramid Pooling Transformer for Scene Understanding[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2023, 45(11): 12760-12771. doi: 10.1109/TPAMI.2022.3202765
[4]	HARIDASAN A, THOMAS J, RAJ E D. Deep Learning System for Paddy Plant Disease Detection and Classification[J]. Environmental Monitoring and Assessment, 2023, 195(1): 120. doi: 10.1007/s10661-022-10656-x
[5]	孙佳照, 李群岭, 林小兴, 等. 基于Resnet-101模型的烟蚜数量图像识别系统开发[J]. 植物医学, 2024, 3(4): 26-31. doi: 10.13718/j.cnki.zwyx.2024.04.004
[6]	LI Z C, ZHOU G X, HU Y W, et al. Maize Leaf Disease Identification Based on WG-MARNet[J]. PLoS One, 2022, 17(4): e0267650. doi: 10.1371/journal.pone.0267650
[7]	LIU H, CUI Y D, WANG J M, et al. Analysis and Research on Rice Disease Identification Method Based on Deep Learning[J]. Sustainability, 2023, 15(12): 9321. doi: 10.3390/su15129321
[8]	BEGUM N, HAZARIKA M K. Prediction of Physico-Chemical Properties in Tomatoes Using Deep Neural Architecture[J]. Agricultural Research, 2024: 1-11.
[9]	LIN J W, CHEN Y, PAN R Y, et al. CAMFFNet: a Novel Convolutional Neural Network Model for Tobacco Disease Image Recognition[J]. Computers and Electronics in Agriculture, 2022, 202: 107390. doi: 10.1016/j.compag.2022.107390
[10]	WU T N, ZHANG Y W, GONG Z W, et al. Quantification of Tobacco Leaf Appearance Quality Index Based on Computer Vision[J]. IEEE Access, 2022, 10: 120352-120368. doi: 10.1109/ACCESS.2022.3221978
[11]	HAN K, WANG Y H, CHEN H T, et al. A Survey on Vision Transformer[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2023, 45(1): 87-110. doi: 10.1109/TPAMI.2022.3152247
[12]	HE F Y, LIU Y, LIU J F. ECA-ViT: Leveraging ECA and Vision Transformer for Crop Leaves Diseases Identification in Cultivation Environments[C]//2024 4th International Conference on Machine Learning and Intelligent Systems Engineering (MLISE). June 28-30, 2024. Zhuhai, China. IEEE, 2024: 101-104 DOI: 10.1109/mlise62164.2024.10674238.
[13]	SCHMIDT-HIEBER J. The Kolmogorov-Arnold Representation Theorem Revisited[J]. Neural Networks, 2021, 137: 119-126. doi: 10.1016/j.neunet.2021.01.020
[14]	SILVEIRA A C C, DO CARMO D S, UEDA L H, et al. VITMST++: Efficient Hyperspectral Reconstruction through Vision Transformer-Based Spatial Compression[J]. IEEE Open Journal of Signal Processing, 2025, 6: 398-404. doi: 10.1109/OJSP.2025.3544891
[15]	ZENG Z H, LIU C B, TANG Z, et al. AccTFM: an Effective Intra-Layer Model Parallelization Strategy for Training Large-Scale Transformer-Based Models[J]. IEEE Transactions on Parallel and Distributed Systems, 2022, 33(12): 4326-4338. doi: 10.1109/TPDS.2022.3187815
[16]	MACDOWALL F D H. Predisposition of Tobacco to Ozone Damage[J]. Canadian Journal of Plant Science, 1965, 45(1): 1-12. doi: 10.4141/cjps65-001
[17]	XUE W X, XU P J, WANG X F, et al. Natural-Enemy-Based Biocontrol of Tobacco Arthropod Pests in China[J]. Agronomy, 2023, 13(8): 1972. doi: 10.3390/agronomy13081972
[18]	HAQUE M A, DEB C K, GOLE P, et al. An Enhanced Vision Transformer Network for Efficient and Accurate Crop Disease Detection[J]. Expert Systems with Applications, 2025, 283: 127743. doi: 10.1016/j.eswa.2025.127743
[19]	MONTAVON G, SAMEK W, MVLLER K R. Methods for Interpreting and Understanding Deep Neural Networks[J]. Digital Signal Processing, 2018, 73: 1-15. doi: 10.1016/j.dsp.2017.10.011
[20]	SHARMA S K, VISHWAKARMA D K. Classification of Banana Plant Leaves Based on Nutrient Deficiency Using Vision Transformer[C]//2024 5th International Conference for Emerging Technology (INCET). May 24-26, 2024, Belgaum, India. IEEE, 2024: 1-6.
[21]	冉渝澳, 金亚波, 王振国, 等. 烟草靶斑病预测模型构建及数字化应用研发[J]. 植物医学, 2024, 3(4): 40-49. doi: 10.13718/j.cnki.zwyx.2024.04.006
[22]	SHINODA R, KATAOKA H, HARA K, et al. Transformer-Based Ripeness Segmentation for Tomatoes[J]. Smart Agricultural Technology, 2023, 4: 100196. doi: 10.1016/j.atech.2023.100196

图( 10) 表( 5)

计量

文章访问数: 1239
HTML全文浏览数: 1239
PDF下载数: 100
施引文献: 0

全文HTML

开放科学(资源服务)标识码(OSID)：
目前，全球有100多个国家和地区种植烟草，烟草种植行业已经成为一些国家的经济支柱^[1]。在中式卷烟的生产中，烟草原料的质量与烟叶的工业可用性直接挂钩，会影响后续的卷烟配方加工和卷烟产品的质量^[2]。由于病虫害的侵扰和危害，烟草的产量和质量逐年下降^[3]。在烟草种植过程中，叶部病害历来是导致作物减产和品质下降的主要原因。烟草在田间生长阶段，烟草气候斑病害是主要发生的非侵染性叶部病害之一。气候变化引起的大气臭氧浓度失衡已被广泛证实是该病害的诱发因素^[4]。在生产过程中，病害种类得以明确后，实施与病害特征相适配的补救方案。目前，烟草气候斑病害的诊断主要依靠传统经验，在病害类型和损害严重程度方面容易出现误判，迫切需要用数字化方法代替传统经验判别，以提高诊断的准确性和效率。

近年来，计算机技术与机器人技术的飞速发展，为烟草病害的智能识别提供了可能。人工智能(AI)与先进分类技术，尤其是基于图像的方法的应用，大幅提升了病害检测的效率^[5]。在玉米病害诊断领域，研究人员采用了WG-MARNet模型并结合数据增强技术，平均分类准确率达到97.96%^[6]。同样，在水稻病害识别方面，改进后的VGG网络架构结合ResNet模型成功检测出稻瘟病、纹枯病和白叶枯病，准确率达98.64%，展现出精准的病害分类能力^[7]。VGGNet19网络用于对番茄成熟度等级进行分类，分类效率达92%^[8]。在烟草病害研究方面，已有研究提出一种名为CAMIFFNet的卷积神经网络模型，用于在田间条件下识别烟草花叶病和烟草赤星病。该模型通过多特征融合模块和坐标注意力机制，能有效提取病害特征并降低环境干扰。实验结果表明，在烟草病害图像分类任务中，CAMIFFNet模型的准确率达到89.71%^[9]。现有模型尽管在病害类型分类方面已取得显著成果，但它们均侧重于识别不同种类的病害，若能对特定病害的严重程度进行分级识别，将进一步提升在农业生产中的实际应用价值。因此，对烟叶病害感染程度进行精准量化，将为针对性防治措施的实施提供更科学的指导，进而优化病害管理策略。

2020年，谷歌团队提出了ViT网络模型，该模型主要应用于图像分类任务。近年来，ViT模型通过各种视觉任务推进的最新技术，取得了显著的成功^[10]。作为一种图像识别模型，与卷积神经网络(Convolutional Neural Network，CNN) 模型相比，ViT模型可以通过自注意力机制捕获图像中不同区域之间的全局依赖关系，从而弥补了CNN在全局信息提取方面的不足，同时，其模块化结构使其易于扩展^[11]，因此，ViT越来越受到研究人员的青睐。例如，He等^[12]提出了一种用于水稻叶片病害识别的ECA-ViT模型，该模型将ECA模块集成到ViT模型的网络中，以弥补ViT模型在提取图像局部特征信息方面的不足。Schmidt ^[13]开发了一种使用迁移学习的ViT模型，用于分类和识别香蕉叶片中营养缺乏的类型。尽管使用了预训练模型来调整超参数并冻结ViT模型的网络层，但该模型在提取局部图像特征方面仍然表现出较弱的能力。上述两项研究都证明了ViT模型在作物病害识别中的效用。在本研究中，需要对受烟草气候斑病害不同程度影响的烟叶进行分类和识别，因此，将ViT模型作为基础模型采用。尽管ViT模型在作物病害图像识别领域表现出色，但它缺乏CNN固有的归纳偏置，并且在提取局部特征信息和处理多尺度信息方面存在不足。

为解决上述问题，本文提出一种基于ViT模型的改进型烟草病害识别模型，即Cu-ViT模型，用于烟草气候斑严重程度的分级识别。在ViT模型的基础上，引入压缩单元替代补丁嵌入，通过卷积层提取局部特征，以提升模型的识别性能。实验结果显示，Cu-ViT模型在模拟测试中的准确率达91.23%，显著高于人工识别准确率(p＜0.05)，单张图像平均识别时间为104.23 ms。

3. 讨论

不同类型的烟草病害之间存在显著差异，而同一种病害的不同严重程度等级之间的差异相对较小，开发用于烟草气候斑病害的等级识别模型具有挑战性。在本研究中，ViT模型被选为基线模型，其在农业分类和识别方面的优越性已得到广泛证实^[18-20]。烟草气候斑病害病变颜色多样且大小不均匀，直接使用ViT模型识别会导致准确率降低，无法作为有效的识别模型。近年来，许多研究人员对ViT模型进行了修改，以适应各种场景需求^[21]。

本研究以ViT模型为基础，考虑到不同严重程度的烟草气候斑病害特征主要位于烟叶的局部区域，因此，为了保留图像所携带的详细特征，将ViT模型的补丁嵌入(使用步长为16的单个16×16卷积)替换为压缩单元。该单元采用3个小型卷积层联级，然后进行ReLU激活，以逐步扩大感受野，从而能够从局部到中局和全局尺度提取多尺度特征。烟草气候斑病害早期(如白点)和晚期(如棕色坏死区域)的形态差异需要根据局部细节进行区分，而压缩单元可以有效地保留这些特征。与单尺度补丁嵌入相比，多尺度特征融合可以提供更丰富的表示，这在区分相似的病害等级(如轻度和中度)时尤为重要。类似的研究方法已应用于其他研究^[22]。在集成压缩单元后，该模型在所有指标上都表现出改进，准确率提高了约5.59%。因此，Cu-ViT模型在烟草气候斑病害图像的分级和识别任务中表现出色。与基线模型相比，它不仅提高了分类准确率，而且有效地减少了不同类别之间的混淆。这一结果对于烟草病害自动识别技术的应用具有重要意义，为针对不同病害等级实施的防控策略提供了精确的判别支持。

随着中国人口老龄化的加速和农业人口的急剧下降，劳动力的严重短缺已成为制约农业生产和可持续发展的主要因素。因此，本研究选取烟草气候斑病害不同损害程度的叶片图像，进行人工识别和Cu-ViT模型识别的比较分析。结果表明，Cu-ViT模型识别的平均准确率接近0.9，大多数数据点都聚集在这个水平附近，表明Cu-ViT模型在识别过程中能保持足够的稳定性和可靠性。相比之下，人工识别的平均准确率略低于模型，而且数据点的分布更为分散。这些测试结果表明，Cu-ViT模型已在实际场景中实现了初步的应用性能，可以在一定程度上替代传统的人工识别。

4. 结论

在本研究中，旨在对烟草气候斑病害的严重程度进行分级和识别。提出的Cu-ViT模型，基于ViT模型框架，通过将压缩单元替代补丁嵌入，提升了ViT模型多尺度和多层次特征提取的能力，并加强了非线性表达。结果表明，Cu-ViT模型在测试中达到了91.23%的准确率，其综合性能优于ResNet152、InceptionResNetV2、SwinT和VGGNet19等先进的图像分类模型。在本研究中，研究对象采用中国主要栽培品种“云烟87”，未来，可以收集更多不同品种的烟草图像作为训练样本，以提高模型的泛化能力。

参考文献 (22)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

留言板

基于Cu-ViT深度学习的烟草气候斑病害分级识别模型的开发应用

1.
广西中烟工业有限责任公司, 南宁 400000

2.
西南大学植物保护学院, 重庆 400715

作者简介:
金亚波，博士，农艺师 .

通讯作者: 罗建钦，高级农艺师

Development and Application of Tobacco Climate Spot Disease Grading Recognition Model Based on Cu -ViT Deep Learning

1.
China Tobacco Guangxi Industrial Co. Ltd., Nanning 530000, China

2.
School of Plant Protection, Southwest University, Chongqing 400715, China

计量

基于Cu-ViT深度学习的烟草气候斑病害分级识别模型的开发应用

通讯作者: 罗建钦，高级农艺师

作者简介: 金亚波，博士，农艺师
1. 广西中烟工业有限责任公司, 南宁 400000

2. 西南大学植物保护学院, 重庆 400715

English Abstract

Development and Application of Tobacco Climate Spot Disease Grading Recognition Model Based on Cu -ViT Deep Learning

Corresponding author: LUO Jianqin

全文HTML

1.1. 数据采集

1.2. ViT模型框架的改进

1.3. 压缩单元模块

1.4. 评估与验证

2.1. 构建训练平台

2.2. 采集数据划分数据集

2.3. 模型结果分析

2.3.1. 确定基础模型

2.3.2. Cu-ViT模型的测定

目录

留言板

基于Cu-ViT深度学习的烟草气候斑病害分级识别模型的开发应用

1. 广西中烟工业有限责任公司, 南宁 400000 2. 西南大学 植物保护学院, 重庆 400715

作者简介: 金亚波，博士，农艺师 .

通讯作者: 罗建钦，高级农艺师

Development and Application of Tobacco Climate Spot Disease Grading Recognition Model Based on Cu -ViT Deep Learning

1. China Tobacco Guangxi Industrial Co. Ltd., Nanning 530000, China 2. School of Plant Protection, Southwest University, Chongqing 400715, China

计量

出版历程

基于Cu-ViT深度学习的烟草气候斑病害分级识别模型的开发应用

通讯作者: 罗建钦，高级农艺师

作者简介: 金亚波，博士，农艺师 1. 广西中烟工业有限责任公司, 南宁 400000 2. 西南大学 植物保护学院, 重庆 400715

English Abstract

Development and Application of Tobacco Climate Spot Disease Grading Recognition Model Based on Cu -ViT Deep Learning

Corresponding author: LUO Jianqin

全文HTML

1.1. 数据采集

1.2. ViT模型框架的改进

1.3. 压缩单元模块

1.4. 评估与验证

2.1. 构建训练平台

2.2. 采集数据划分数据集

2.3. 模型结果分析

2.3.1. 确定基础模型

2.3.2. Cu-ViT模型的测定

目录

1.
广西中烟工业有限责任公司, 南宁 400000

2.
西南大学植物保护学院, 重庆 400715

作者简介:
金亚波，博士，农艺师 .

1.
China Tobacco Guangxi Industrial Co. Ltd., Nanning 530000, China

2.
School of Plant Protection, Southwest University, Chongqing 400715, China

作者简介: 金亚波，博士，农艺师
1. 广西中烟工业有限责任公司, 南宁 400000

2. 西南大学植物保护学院, 重庆 400715