基于CapsNet神经网络的树叶图像分类模型

张冬妍; 韩睿; 张瑞; 曹军

doi:10.13718/j.cnki.xdzk.2021.08.018

基于CapsNet神经网络的树叶图像分类模型

东北林业大学机电工程学院，哈尔滨 150040

基金项目: 黑龙江省自然科学基金项目(C2017005)

详细信息

作者简介:
张冬妍，副教授，博士，主要从事机器学习，图像处理研究 .

中图分类号: TP391.4;S718.3

A Neural Network-Based Leaf Image Classification Model

College of Mechanical and Electrical Engineering, Northeast Forestry University, Harbin 150040, China

摘要: 对树木研究的基础是对其进行分类处理. 本文结合CapsNet神经网络模型，以提高树叶分类的准确率为目的，使用实验室拍摄的10种树叶图片建立树叶分类模型. 考虑到模型效率和图像大小，在原有CapsNet上与传统卷积神经网络相结合，通过优化动态路由算法对CapsNet进行改进，得到了E-CapsNet网络模型，同时与经典的神经网络模型AlexNet和Inception V3模型进行对比. 经过50次epoch的训练，模型训练准确率最高达到99.15%，验证集的准确率为98.51%，测试集准确率为98.63%，对比原CapsNet网络，测试集准确率提高了2.51%. 实验结果表明，改进后的E-CapsNet模型实现了更高的精度.
- 胶囊网络 /
- 神经网络 /
- 图像分类 /
- 树叶识别 /
- 动态路由
Abstract: The basis of research of trees is to classify them. Combined with the CapsNet neural network model, 10 kinds of leaf pictures taken in the laboratory are used to establish a leaf classification model so as to improve the accuracy of leaf classification. Considering the efficiency and image size of the model, an E-CapsNet network model is obtained by combining the original CapsNet with the traditional convolutional neural network and optimizing the dynamic routing algorithm to improve the CapsNet. At the same time, the E-CapsNet network model is compared with the classical neural network model AlexNet and InceptionV3 model. After 50-epoch training, the highest accuracy of model training is 99.15%, the accuracy of verification set is 98.51%, and the accuracy of test set is 98.63%. Compared with that of the original CapsNet network, the accuracy of the test set is improved by 2.51%. The experimental results show that the improved E-CapsNet model achieves higher accuracy.
- capsule network /
- neural network /
- image classification /
- leaf recognition /
- dynamic routing .

图 1 胶囊之间的传播过程

下载: 全尺寸图片幻灯片

图 2 树叶图片

下载: 全尺寸图片幻灯片

图 3 数据增强示例

下载: 全尺寸图片幻灯片

图 4 胶囊网络模型

下载: 全尺寸图片幻灯片

图 5 模型训练曲线

下载: 全尺寸图片幻灯片

图 6 不同优化方法的训练准确率曲线

下载: 全尺寸图片幻灯片

表 1 数据集数量

	原图像数量/张	数据增强后图像数量/张		原图像数量/张	数据增强后图像数量/张
桉树	297	1 485	水翁树	267	1 335
深山含笑	443	2 215	桃花心木	307	1 535
龙眼	306	1 530	香樟	259	1 295
木荷	262	1 310	柚树	272	1 360
荷花木兰	218	1 090
珊瑚树	562	2 810	总计	3 193	15 965

下载: 导出CSV

表 2 E-CapsNet参数设置

Name	Input shape	Output shape
Input(输入层)	(None，147，147，1)	(None，147，147，1)
Con-1	(None，147，147，1)	(None，71，71，8)
Con-2	(None，71，71，8)	(None，66，66，16)
Maxpool	(None，66，66，16)	(None，33，33，16)
Con-3	(None，33，33，16)	(None，28，28，256)
Pcaps(Con2d)	(None，28，28，256)	(None，10，10，256)
Pcaps(Reshape)	(None，10，10，256)	(None，3200，8)
Pcaps(Squash)	(None，3200，8)	(None，3200，8)
DigitCaps	(None，3200，8)	(None，10，16)
OutCaps	(None，10，16)	(None，10)

下载: 导出CSV

表 3 E-CapsNet模型的分类训练结果

方法	模型训练准确率/%	模型训练损失率/%	验证集准确率/%	验证集损失率/%	测试集准确率/%
E-CapsNet	99.15	0.01589	98.51	0.02049	98.63

下载: 导出CSV

表 4 测试集准确率对比

方式	测试集准确率	方式	测试集准确率
AlexNet	87.0	CapsNet	96.12
Inception V3	91.0	E-CapsNet	98.63

下载: 导出CSV

表 5 在动态路由环节使用不同优化方法的准确率对比

方法	训练集准确率	测试集准确率
原动态路由算法	96.32%	95.86%
使用Adam优化	98.65%	97.47%
本文方法	99.15%	98.63%

下载: 导出CSV

[1]	刘春爽. 基于植物叶形状和叶脉的植物叶自动分类研究[D]. 杭州: 浙江理工大学, 2016.
[2]	恩德, 忽胜强. 基于集成神经网络的植物叶片识别方法[J]. 浙江农业学报, 2015, 27(12): 2225-2233. doi: 10.3969/j.issn.1004-1524.2015.12.28
[3]	于业达, 顾偌铖, 唐运林, 等. 基于深度学习的草地贪夜蛾自动识别[J]. 西南大学学报(自然科学版), 2019, 41(9): 24-31. doi: http://xbgjxt.swu.edu.cn/article/doi/10.13718/j.cnki.xdzk.2019.09.004
[4]	LECUN Y, BENGIO Y. Convolutional Networks for Images, Speech, and Time Series[J]. Handbook of Brain Theory & Neural Networks, 1995, 3361(10): 1995.
[5]	杨珍, 王俊, 辛春花. 利用DCE-MRI结合改进卷积神经网络的MR图像自动分割与分类方法[J]. 重庆理工大学学报(自然科学), 2020, 34(2): 147-157. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-CGGL202002022.htm
[6]	崔少国, 熊舒羽, 刘畅, 等. 基于深度哈希卷积神经网络的医学图像检索[J]. 重庆理工大学学报(自然科学), 2020, 34(8): 134-142. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-CGGL202008020.htm
[7]	KRIZHEVSKY A, SUTSKEVER I, HINTON G E. ImageNet Classification with Deep Convolutional Neural Networks[J]. Communications of the ACM, 2017, 60(6): 84-90. doi: 10.1145/3065386
[8]	ZEILER M D, FERGUS R. Visualizing and Understanding Convolutional Networks[C] //Computer Vision-ECCV 2014, 2014: 818-833. DOI: 10.1007/978-3-319-10590-1_53.
[9]	SIMONYAN K, ZISSERMAN A. Very Deep Convolutional Networks for Large-Scale Image Recognition[EB/OL]. (2014-09-01)[2020-09-15]. https://www.researchgate.net/publication/319770291_Very_Deep_Convolutional_Networks_for_Large-Scale_Image_Recognition.
[10]	SZEGEDY C, LIU W, JIA Y Q, et al. Going Deeper with Convolutions[C] //2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). June 7-12, 2015, Boston, MA, USA. IEEE, 2015: 1-9.
[11]	HE K, ZHANG X Y, REN S Q, et al. Deep Residual Learning for image Recognition[C] //2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). June 27-30, 2016, Las Vegas, NV, USA. IEEE, 2016: 770-778.
[12]	GRINBLAT G L, UZAL L C, LARESE M G, et al. Deep Learning for Plant Identification Using Vein Morphological Patterns[J]. Computers and Electronics in Agriculture, 2016, 127: 418-424. doi: 10.1016/j.compag.2016.07.003
[13]	SLADOJEVIC S, ARSENOVIC M, ANDERLA A, et al. Deep Neural Networks Based Recognition of Plant Diseases by Leaf Image Classification[J]. Computational Intelligence and Neuroscience, 2016, 2016: 3289801.
[14]	张帅, 淮永建. 基于分层卷积深度学习系统的植物叶片识别研究[J]. 北京林业大学学报, 2016, 38(9): 108-115. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-BJLY201609014.htm
[15]	CRUZ A C, LUVISI A, DE BELLIS L, et al. Vision-Based Plant Disease Detection System Using Transfer and Deep Learning[C] //2017 Spokane, Washington July 16-July 19, 2017. St. Joseph, MI: American Society of Agricultural and Biological Engineers, 2017: 1.
[16]	doi: http://www.sciencedirect.com/science/article/pii/S1537511018307797 BARBEDO J G A. Plant Disease Identification from Individual Lesions and Spots Using Deep Learning[J]. Biosystems Engineering, 2019, 180: 96-107.
[17]	SABOUR S, FROSST N, HINTON G E. Dynamic Routing Between Capsules[EB/OL]. (2020-09-22)[2020-10-15]. https://www.cnblogs.com/MTandHJ/p/13659001.html.
[18]	ZHANG X Q, ZHAO S G. Fluorescence Microscopy Image Classification of 2D HeLa Cells Based on the CapsNet Neural Network[J]. Medical & Biological Engineering & Computing, 2019, 57(6): 1187-1198. doi: 10.1007/s11517-018-01946-z
[19]	MOBINY A, VAN NGUYEN H. Fast CapsNet for Lung Cancer Screening[M] //Medical Image Computing and Computer Assisted Intervention-MICCAI 2018. Cham: Springer International Publishing, 2018: 741-749.
[20]	陈立潮, 郑佳敏, 曹建芳, 等. 基于胶囊网络的智能交通标志识别方法[J]. 计算机应用, 2020, 40(4): 1045-1049. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JSJY202004019.htm

图( 6) 表( 5)

计量

文章访问数: 941
HTML全文浏览数: 941
PDF下载数: 287
施引文献: 0

全文HTML

目前，世界上大约有6万多种树木，对树木研究的基础是对其进行分类处理，所以对其分类的方法进行研究具有很重要的意义. 相对于树干、树形和树木等生物信息，树叶具有特定的外形轮廓和纹理等固有特征，易于区分和鉴定，常作为区分树木种类的重要标志^[1]. 树叶的分类与识别对于区分树的种类、对树木物种种群的跟踪和保护、建立树木种类数据库、植物基础医学研究、树木分布等具有十分重要的意义^[2].

传统的树叶分类识别主要基于图像处理技术，对树叶图像进行认为选定的特征来进行分类，识别效率较低且泛化能力弱. 近年人工智能快速发展，基于深度学习的算法在图像分类识别方面表现出巨大的优势，可以快速而有效地提取和分析图像中复杂深层次的特征，对于图像分类识别具有很好的效果^[3].

文献[4-6]研究了卷积神经网络在图像和语音中的应用，Krizhevsky^[7]2012年在ILSVRC图像识别比赛中使用AlexNet模型获得冠军，首次实现了15.40%的错误率，引起了深度学习和卷积神经网络研究的兴起和爆炸性增长. 在后续的ZFnet，VGG，GoogleNet，Resnet等深度学习网络模型中^[8-11]，图像识别的错误率逐渐下降到2.25%，展现出深度学习在图像分类识别中的优势. Grinblat等^[12]利用静脉形态学的模式识别方法对植物品种进行识别，能够准确识别3种豆科植物. 2016年，Sladojevic等^[13]利用深层神经网络识别了13种植物病虫害，平均准确率为96.30%. 同年，张帅等^[14]设计了一个8层卷积神经网络学习系统，并用softmax和SVM两种分类器进行树叶分类，对单一背景下的树叶分类准确率高达91.11%和90.90%. 2017年，Cruz等^[15]研究了一种基于迁移学习和深度学习的可视化植物病害检测系统，采用卷积神经网络结合迁移学习的方式，对少量图像样本进行训练和验证，可以自动、定量地检测早期植物病害，降低了诊断时间和成本. 2019年，Barbedo等^[16]采用CNN和GoogleNet结构进行深度学习，建立了有效的病虫害检测与识别模型，并与原始图像进行了病虫害和斑点的特征提取，而原始图像在不使用手工去除背景的情况下，整体准确率提高到94%.

为了提高树叶分类的准确性，本文使用CapsNet神经网络模型对树叶进行分类识别. 首先，建立了树叶图像的数据集; 其次，对数据集中的树叶图像进行预处理和数据增强; 最后，对CapsNet网络进行优化改进，对处理后的图像进行训练和预测. 实验结果表明，改进后的CapsNet在树叶分类上的效果明显优于原CapsNet，有助于实现树叶种类的快速识别，为建立树种数据库、树木种群的跟踪和保护提供了重要的技术储备.

4. 结论

在本文中，我们采用改进的CapsNet神经网络对树叶进行分类实验，将CNN结构与CapsNet网络结合，更好地适应了数据集图像尺寸，同时提高了模型性能，克服了传统人工卷积神经网络分类器的某些局限性，并使用数据增强来减少模型的过拟合，提高了模型的泛化能力. 在优化了Rounting算法和Squashing函数环节后，模型收敛更加平滑，收敛速度更快，分类识别准确率也有提升，实现了比原结构更好的性能. 同时，我们还设计了对比实验，实验结果表明，本文训练出的用于树叶分类的E-CapsNet网络模型的测试准确率达到98.63%，明显高于AlexNet和InceptionV3模型和原CapsNet.

CapsNet目前仍处在起步阶段，在以后的研究工作中，把重点放在优化内部结构或者与已有的成熟网络模型相结合上，可能会在优化模型性能上更有发展.

参考文献 (20)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

留言板

基于CapsNet神经网络的树叶图像分类模型

东北林业大学机电工程学院，哈尔滨 150040

作者简介:
张冬妍，副教授，博士，主要从事机器学习，图像处理研究 .

A Neural Network-Based Leaf Image Classification Model

College of Mechanical and Electrical Engineering, Northeast Forestry University, Harbin 150040, China

计量

基于CapsNet神经网络的树叶图像分类模型

作者简介: 张冬妍，副教授，博士，主要从事机器学习，图像处理研究
东北林业大学机电工程学院，哈尔滨 150040

English Abstract

A Neural Network-Based Leaf Image Classification Model

全文HTML

1.1. CapsNet神经网络

1.2. 胶囊之间的传播过程

1.3. 囊间动态路由算法

1.4. 损失函数

2.1. 数据准备和预处理

2.2. 动态路由算法的改进

2.3. 使用的CapsNet网络结构

2.4. 实验参数设定

2.5. 实验环境

2.6. 模型评价指标

目录

留言板

基于CapsNet神经网络的树叶图像分类模型

东北林业大学 机电工程学院，哈尔滨 150040

作者简介: 张冬妍，副教授，博士，主要从事机器学习，图像处理研究 .

A Neural Network-Based Leaf Image Classification Model

College of Mechanical and Electrical Engineering, Northeast Forestry University, Harbin 150040, China

计量

出版历程

基于CapsNet神经网络的树叶图像分类模型

作者简介: 张冬妍，副教授，博士，主要从事机器学习，图像处理研究 东北林业大学 机电工程学院，哈尔滨 150040

English Abstract

A Neural Network-Based Leaf Image Classification Model

全文HTML

1.1. CapsNet神经网络

1.2. 胶囊之间的传播过程

1.3. 囊间动态路由算法

1.4. 损失函数

2.1. 数据准备和预处理

2.2. 动态路由算法的改进

2.3. 使用的CapsNet网络结构

2.4. 实验参数设定

2.5. 实验环境

2.6. 模型评价指标

目录

东北林业大学机电工程学院，哈尔滨 150040

作者简介:
张冬妍，副教授，博士，主要从事机器学习，图像处理研究 .

作者简介: 张冬妍，副教授，博士，主要从事机器学习，图像处理研究
东北林业大学机电工程学院，哈尔滨 150040