-
开放科学(资源服务)标识码(OSID):
-
病害是制约农业生产的重要因素之一,严重影响着农作物的产量和品质[1]. 随着作物品种类型的不断丰富,病害发生的种类及数量也在增加,使得作物病害有效防治面临着重大挑战[2]. 近年来由于气候变化的影响,肆虐主要粮食和经济作物的病害正变得更具破坏性,并对粮食安全和环境构成越来越大的威胁[3]. 联合国粮农组织(FAO)2021年发布的科学报告指出,世界范围内每年因病虫害造成的农作物产量损失占全球农作物产量的40%[4]. 病害的防治已经成为目前农业生产管理中最基本、最重要也是最值得关注的问题之一.
在作物病害的预防与治理中,首先需要精确识别作物所遭受的病害,并对这些病害的种类进行区分,对其严重程度进行评估[5]. 传统的作物病害识别诊断由植保技术人员或者有经验的农业从业者在作物生长期通过田间作业进行人工观察判断,虽然有一定的准确率,但需要耗费大量的时间和人力物力,难以在大范围内展开,且受观察者自身经验的影响,具有主观性强、效率低、时效性差的缺点,导致经常出现杀菌剂的不当施用,不仅增加了农业生产成本,广泛施药也容易使得作物降质减产,并对环境造成污染[6]. 随着计算机视觉、光学、遥感和物联网技术的发展,可以从不同尺度上采集到RGB数码图像、多光谱、高光谱等多源作物信息,基于图像的作物病害自动识别得到了国内外学者的广泛关注,在病害特征提取和分类、病害目标检测和识别及相关算法改进、病害监测预警平台建设等方面开展了大量研究工作,展现出在作物病害诊断和不同植株病害高效识别上的独特潜力和优势[7-11],可为作物病害的“有效防控”与“精准施药”提供直接支持,对于有效保障作物的产量和品质、提高农药利用率、降低环境风险、促进农业可持续性发展具有重要的应用价值和发展前景[12].
全球作物病害图像识别研究正在迅速发展,系统分析和总结现有研究成果,对于揭示该领域的总体特征与热点前沿,探索未来研究方向,寻求不同国家、研究机构和作者之间的合作具有重要意义. 目前,虽然有文献[13-15]对作物病害图像识别的相关研究进展进行过介绍,但主要集中在某些特定技术方面,全面详细的分析还比较有限,对于作物病害图像识别相关内容的计量整合分析更是十分缺乏,很难从整体上系统把握该领域的研究特征和发展趋势. 作为一种基于统计学和数学的定量分析方法,文献计量法通过分析文献的分布结构、数量关系和变化规律,已成为对各研究领域总体发展、研究热点及趋势进行分析的得力工具,具有客观和定量的优势[16]. 有鉴于此,为量化梳理作物病害图像识别研究进展,本研究应用文献计量法对2002-2022年累计20年间全球相关的核心期刊文献进行分析,借助文献的各种数量特征和知识图谱可视化解析,并结合相关文献阅读,全面揭示该研究领域的发展特征及热点趋势,在此基础上对未来研究工作提出建议和展望,以期为中国作物病害图像识别的深入研究提供参考.
全文HTML
-
选择科学引文数据库(Web of Science,WOS)的核心合集(Web of Science Core Collection)数据库作为检索数据库,WOS数据集的索引选择科学引文索引扩展(Science Citation Index Expanded,SCI-E),检索时间范围为2002/01/01-2022/12/31,检索时间为2023年8月18日,文献类型设置为Article或Review,语言为English,以TS=(((“crop* disease*”) OR (“plant* disease*”)OR (“leaf disease*”) OR(“leaves disease*”)) AND (detection OR recognition OR identification OR treatment* OR diagnosis) AND (image* OR hyperspectral OR multispectral OR dataset*))为检索条件进行高级检索,共筛选出文献1 193篇,剔除无关文献和经去重处理后最终得到1 056篇文献.
-
1) 使用WOS自带的分析功能对1 056篇文献进行发文年度变化、国家/地区、研究机构、出版物、作者、所属学科等信息的计量分析,利用Excel 2019与Origin 2023软件进行统计图计算与绘制,采用发文量、总被引频次、篇均被引频次、h指数等指标定量评估文献的数量和质量.
2) 将检索筛选后的1 056篇文献以纯文本形式导出,利用VOSviewer(v1.6.19)软件对检索数据进行共现分析和关键词频数统计. 共现分析的内容及主要参数分别设置如下:①基于检索数据构建文献发表国家/地区、研究结构合作网络图谱,分析类型选择“Co-authorship”,分析单元分别选择“Countries”和“Organizations”,阈值均设为10;②基于检索数据构建关键词共现密度图谱,分析类型选择“Co-occurrence”,分析单元为“All keywords”,频数阈值设为20. 关键词频数统计不设置阈值.
3) 利用CiteSpace 6.2.4软件对导出的检索数据进行关键词突现分析,其中文献时间跨度设定为2002-2022年,节点类型设为“keyword”,时间切片为1年,选择标准为Top 10%.
1.1. 数据来源
1.2. 研究方法
-
不同年份的发文量能够反映研究人员对该领域的关注程度,一定程度上表明了相关研究领域的发展程度和发展速度[17]. 对WOS收集到的1 056篇文献进行发文时间统计,可以看到2002-2022年间作物病害图像识别文献的年度发文量整体呈明显的上升趋势(图 1). 从统计数据来看,作物病害图像识别研究大体分为3个阶段:2002-2011年为初始期,相关研究较少,年均论文产出不到10篇,处于缓慢培养阶段;2012-2018年为增长期,年均论文产出超过30篇,研究逐渐得到越来越多学者的重视;2019-2022年为爆发期,论文数量大幅度增加,占2002-2022年间总发文量的83.71%,研究方法、研究内容和研究范围都取得了长足发展[18-20],这与人工智能发展第三次浪潮的时间节点高度吻合. 目前全球农业正处于面向智慧农业的转型时期,人工智能、物联网、大数据、传感器等技术的突破为其提供了创新动力,以上统计数据可以看出作物病害图像识别研究正成为当下作物病害防治关注的焦点.
-
不同区域的论文发表数量一定程度上可以代表该国家/地区在某领域研究的活跃程度,而被引频次则体现了所发表论文在该领域的国际影响力[17]. 对全球作物病害图像识别研究发文量Top 10的国家/地区进行统计(表 1),其中中国发文量为389篇,占总发文量的36.84%,排名世界第1位,体现出中国在该研究领域学术上的活跃性. 但是,虽然中国在总发文量、总被引频次和h指数上均处于世界领先,篇均被引次数却偏低,表明虽然近年来中国在作物病害图像识别研究领域非常活跃,产出的论文数量也较多,但在全球范围内受关注的程度依然不太高,研究创新点或突破性还有待进一步提升. 从国家/地区来看,美国的发文量和篇均被引次数均较高,是作物病害图像识别研究发展非常强劲的国家;德国、意大利和英格兰在Top 10的国家/地区中发文量排名较后,但篇均被引频次高,尤其是德国篇均被引频次高达80.42,该领域被引频次Top 10的论文中有3篇来自德国[21-23],研究质量和影响力受到全球广泛关注;印度、巴基斯坦、沙特阿拉伯这些国家虽然发文量排在第2、4、5位,但篇均被引频次均较低,研究成果的质量和影响力与先进国家相比仍有较大差距.
为进一步了解不同国家/地区之间在作物病害图像识别研究领域的合作关系,利用VOSviewer软件对Top 10的国家/地区绘制合作图谱(图 2). 图谱中形成了2大合作聚类,左侧聚类以中国、美国、德国为核心,右侧聚类包括印度、巴斯基斯、沙特阿拉伯、韩国. 10个国家/地区之间均有合作关系,合作交流比较密切. 除此之外,图谱中最宽的连线出现在中美两国之间,共有38篇合作文献,其次是巴基斯坦与沙特阿拉伯以及印度与沙特阿拉伯,分别有27篇和19篇,表明以上国家之间的合作最为密切.
-
分析研究结构的分布可以帮助了解不同学术机构对该领域的投入和认可程度,从而有利于机构之间的合作[24]. 全球开展作物病害图像识别的研究机构中,发文量排在Top 10的机构有6家来自中国,2家来自美国,德国和巴基斯坦各有1家(表 2). 其中中国科学院发文量为50篇,占世界总发文量的4.74%,排名第2和第4的分别为中国农业大学(42篇)和国家农业信息化工程技术研究中心(29篇),此外安徽大学、中国农业科学院、北京农林科学院的发文量也进入了Top 10,体现出中国科研机构的整体优势. 德国波恩大学发文量为29篇,但总被引频次、篇均被引频次和h指数均为世界第1,展现出很高的科研成果质量. 美国农业部农业研究局、佛罗里达大学和巴基斯坦伊斯兰堡COMSATS大学也是作物病害图像识别研究的主要核心机构.
从TOP 10的研究机构合作图谱(图 3)来看,大部分机构之间的交流与合作均较为密切,如中国科学院、中国农业大学、国家农业信息化工程技术研究中心、安徽大学、德国波恩大学、美国农业部农业研究局和佛罗里达大学均有直接的交流与合作.
-
对核心出版物进行分析,能够帮助研究人员掌握研究领域的主要期刊,为文献查询、论文撰写及投稿提供指导[17]. 统计2002-2022年全球作物病害识别研究领域发文量Top 10的出版物,如表 3所示. Computers and Electronics in Agriculture是刊载作物病害图像识别相关研究文章数量最多的期刊,发文量占领域发文总量的11.74%,无论是总被引频次、篇均被引频次和h指数均排在第1位,该刊从本世纪初就开始关注作物病害的图像自动识别诊断研究,目前领域被引频次前10的论文中有5篇来自该刊[21, 25-28],是发表作物病害图像识别研究最具影响力的国际期刊. 其次是Frontiers in Plant Science和Remote Sensing,发文量占比分别为8.05%和5.49%,总被引频次和篇均被引频次中等偏上. 值得注意的是Precision Agriculture,该刊作为一本双月刊刊载论文数量少,但是篇均被引频次达到50.35,期刊刊载论文质量较高,体现出小而精的特点.
文献核心作者是科学研究的主体,可以反映一个领域的杰出贡献者. 利用普赖斯定律法[29]进行核心作者判断:根据普赖斯公式Mp=0.749(Npmax)1/2,Mc=0.749(Ncmax)1/2,其中Npmax和Ncmax分别为最高产作者所发表论文的数量和最高被引频次作者的总被引次数,Mp和Mc值为区分核心作者与非核心作者的分界值,即发表论文数量和被引频次分别大于Mp和Mc值者为核心作者. 本研究领域中发文数量和被引频次最多的作者均为德国波恩大学的MAHLEIN A K,发文量和被引频次分别为23篇和2 575次,分别代入公式,计算得到Mp=3.59,Mc=38.01,因此发文量≥4篇且被引频次≥39的作者即为核心作者. 目前作物病害图像识别研究领域有3 807位作者发表过学术研究论文,核心作者173名,文章发表数量排在Top 10的核心作者主要来自德国、中国和巴基斯坦(表 4). 来自德国波恩大学的MAHLEIN A K以23篇论文占据全球作物病害图像识别研究发文量的首位,其总被引频次、篇均被引频次和h指数均名列第1,其中有3篇论文位列领域被引频次Top 10[21-23],是该领域全球备受关注的学者. 中国以7名作者在Top 10的核心作者中占据绝对优势,发表论文数量、总被引次数和h指数均在国内学者中占据首位的是来自中国科学院的HUANG W J研究员. HUANG W J长期从事植被遥感机理与病虫害应用研究,在作物病害图像识别研究方面取得了丰硕的成果,其团队另外2名研究人员DONG Y Y和SHI Y发文量分别排在第4和第10,这些学者是国内从事作物病害监测和图像识别研究的重要力量,在国内外均具有较强的影响力.
-
作物病害图像识别发表论文共涉及38个研究领域,其中发文量排在Top 10的学科如图 4所示. 计算机科学发文量最多,共计400篇,占总发文量的37.88%;其次是农学(330篇,31.25%)、植物科学(252篇、23.86%)和工程(251篇,23.78%). 此外,还涉及环境生态学、影像科学与摄影技术、通信、遥感、地质、自然科学(其他主题)等多个学科. 作物病害的图像识别是面向智慧农业的重要组成,涉及学科领域分布广泛,以计算机科学、农学、植物科学、工程和遥感领域研究为主,并且逐渐向其它学科领域渗透,利用多学科的交叉理论与方法来研究不同尺度下的作物病害自动监测与识别已经成为趋势.
-
关键词是对文章核心内容的高度提炼和概括,其出现频次和共现密度可以反映出某领域的研究热点[17]. 利用VOSviewer对1 056篇文献进行分析,共得到3 307个关键词,大量关键词的出现意味着作物病害图像识别研究的广泛性和研究焦点的差异性,对同义词进行合并后统计出现频次Top 30的高频关键词(表 5),同时利用VOSviewer对出现频次超过20次的关键词绘制共现密度图谱(图 5),图谱中颜色从绿到红表示关键词共现频次越来越高.
根据高频关键词统计和共现密度图谱并结合相关文献阅读,梳理归纳该领域的研究文献,可以发现过去20年作物病害图像识别研究热点主要呈现以下内容:
1) 作物病害图像数据获取:主要关键词有图像、遥感、植被指数、高光谱成像、传感器、表型等. 引起作物病害的病原体以真菌为主[30],不同的病原菌危害作物过程中,被侵染作物外部的形态、颜色及生理等会发生变化,这些特征变化为作物病害的图像识别提供了契机[31],因此获取作物病害图像数据是进行病害识别的首要任务. 作物病害的图像数据获取主要分为4类:①基于田间/室内的手持式设备数据获取. 利用专业的相机或者手机在田间或室内拍摄的图像是作物病害数据的主要来源,同时国内外研究人员还自行研发了一些小型便携式农业病害图像采集仪,可灵活地将相机镜头推送至采集部位,通过调整相机位置,控制相机拍照实现对作物叶片和冠层的数据采集[32-33]. 这些手持式设备制造成本较低,具有良好的采集灵活性,但是人工成本高,数据采集范围有限,无法满足高频率、大范围的数据采集需求. ②基于遥感的数据获取. 随着遥感技术特别是无人机技术的发展和成本的降低,以无人机为代表通过装载不同传感器在大规模田间环境下进行数据采集的遥感方式受到研究人员的广泛关注[34-37]. 相比传统田间定位,遥感监测能够迅速采集信息,空间覆盖率广,可以从叶片、冠层和区域尺度获得高空间分辨率、高时间分辨率和高光谱分辨率的影像[38]. ③基于田间/室内的高通量作物表型数据获取平台. 这些平台搭载了成像组件(高分辨率相机、多光谱仪、高光谱仪、热成像仪等)以车载、轨道式、自走式、门架式、悬索式等不同方式布设在田间或室内,能够全自动、无损、高通量对大量植株进行表型成像[39-42]. 但高通量平台价格昂贵,设备维护成本高,传感器组的校准、恶劣天气条件下工作稳定性等技术难题仍未得到有效解决. ④作物病害公开数据集. 目前公开的作物病害数据集主要包括Plant Village[43]、AI Challenger 2018[44]、Fgvc7[45]、Fgvc8[46]、PlantDoc[47]、Rice Leaf Disease Image Samples[48]、LWDCD[49]、Wheat Leaf Dataset[50]、CGIAR Computer Vison for Crop Disease[51]等,主要为RGB数码图像,涵盖了小麦、水稻、玉米、苹果、葡萄、番茄、棉花、马铃薯、甜菜等20余种作物,近百种病害类别.
2) 基于机器学习的作物病害图像识别:主要关键词有分类、识别、机器学习、特征提取、机器视觉、人工智能、支持向量机、随机森林等. 自动化和智能化是近20年作物病害图像识别研究的主要发展方向[52],从基于机器学习的作物病害图像识别研究被引频次Top 10的文献(表 6)可以看出,作为实现自动化和智能化的重要手段,机器学习在主要粮食和经济作物病害识别中得到了较为广泛的应用. 由于作物受病害侵染达到一定程度后作物表型及生理等会发生变化,基于这些明显特征的变化进行病害特征信息提取,并在此基础上选择合适的分类模型进行分类从而完成对不同病害的图像识别是机器学习的主要方式,而特征提取和分类器的选择是机器学习最重要的2个部分[53].
在特征提取方面,对于RGB数码图像提取的目标以病害叶片、病斑为主,主要有形态提取[54]、颜色提取[55]、纹理提取[56]以及颜色、纹理、形态相结合的提取[57]. 对于多光谱和高光谱图像,与病害胁迫相关的光谱特征和植被指数特征是最常被使用的2类特征提取信息[58-59]. 前者主要利用光谱反射率在作物表面病害区域和健康区域的差异,通过对不同作物不同胁迫的光谱响应分析确定具体某一个特定的波谱区间甚至特定波段. 后者是指使用多光谱或高光谱数据经线性或非线性计算产生的与作物病害症状密切相关的敏感植被指数,如归一化植被指数[60]、差异植被指数[61]、重归一化差异植被指数[62]、叶片叶绿素指数[63]等,从而建立基于敏感植被指数特征的作物病害识别模型,在对小麦、水稻、棉花等作物病害识别上取得了较好的效果[64-66]. 此外由于作物病害发生初期,病害的危害较轻,但光谱信息仍会有细微变化,因此光谱特征对于早期作物病害识别监测具有特别的优势.
在分类器的选择上,经典的分类器如支持向量机(Support Vector Machine,SVM)、随机森林(Random Forest,RF)、人工神经网络(Artificial Neural Network,ANN)、决策树(Decision Tree,DT)、径向基函数(Radial Basis Function,RBF)网络、逻辑回归(Logistic Regression,LR)算法、K最近邻(K-Nearest Neighbor,KNN)算法等均可用于作物病害图像识别,其中SVM、RF和ANN等应用最为普遍[67-68]. 同时很多研究还对分类器效果进行了对比试验与评价,如Almoujahed等[69]以识别小麦生长晚期赤霉病为研究目标,通过推扫式高光谱平台拍摄高光谱图像构建数据集,用于SVM、LR、ANN等机器学习分类算法的训练,试验结果表明,小麦生长晚期可以利用400~1 000 nm光谱范围的高光谱相机在田间条件下对小麦赤霉病进行准确识别,其中SVM的性能优于LR和ANN.
基于机器学习的识别方法有鲁棒性强、对计算资源要求不太高以及特征解释能力较强等方面的优势,在作物病害图像识别方面取得了一定的成效. 但自动诊断模型的性能很大程度上依赖所获取图像的质量和人工选择的特征,而人工选择特征需要很强的专业背景和知识储备,并具有较强的主观性. 同时受作物类型、病害种类、拍摄环境等因素的影响,作物病害症状复杂多样,不少病害对作物表型造成的损伤没有明显清晰的边界,人工很难对特征设计进行深入细致的优化,这些困难使得识别模型在模型精度方面,特别是在复杂场景下很难获得进一步提升[52].
3) 基于深度学习的作物病害图像识别:主要关键词有深度学习、卷积神经网络、识别、目标检测、分割、迁移学习、图像处理、数据增强等. 深度学习脱胎于机器学习,但相比传统机器学习复杂的特征提取工作,深度学习可以自动挖掘图像中的深层分类特征进而提升识别的准确度,实现了特征提取和分类的一体化,避免了人为特征选择和分阶段组合训练所导致的局限[78].
在深度学习中,卷积神经网络因其优秀的性能在图像识别领域得到了广泛的重视,已涌现许多经典的模型,如LeNet[79]、AlexNet[80]、GoogLeNet[81]、VGGNet[82]和ResNet[83]等,在图像级图像分类任务中展现出很强的优势. 研究人员围绕如何利用已有的卷积神经网络进行作物病害图像识别开展了大量的工作,如Mohanty等[84]采用Plant Village数据集的14种作物共26种实验室受控简单背景病害图像,利用GoogLeNet和AlexNet进行训练,通过统一训练和测试,发现在测试集中的平均识别准确率分别为99.34%和85.33%. 此外为了减少训练参数,提升网络收敛速度,并提高识别模型的泛化能力和预测精度,不少研究人员在已有经典网络模型的基础上进行了改进和优化,主要包括网络架构的优化[85]、样本数据正则化处理[86]和网络深度调整[87]等.
由于大量在实际自然环境下采集的作物病害图像数据包含了复杂的环境背景,为了准确获取病害目标在图像中的位置,并给出所属类别信息,目标检测算法被应用在作物病害目标级识别检测中. 目前,目标检测主要有2类算法:一类是基于回归思想的单阶段算法,主要代表为YOLO[88]和SSD[89];另一类是基于分类思想的两阶段算法,主要代表有R-CNN[90]、Fast R-CNN[91]和Faster R-CNN[92]. 从表 7可以看出2类目标检测算法均在作物病害目标级检测识别中得到应用. 使用单阶段算法的学者选择YOLO系列算法的居多,不少研究聚焦于网络结构的改进以提高识别精度[93],有的则专注于网络的轻量化工作,在获得更高准确率的同时提升了识别速度[94]. 由于两阶段算法能够选择不同的主干结构和特征融合方式,如何获取更好的卷积特征以及如何融合不同尺度的特征从而获得更好的识别效果,成为很多使用两阶段算法研究人员聚焦的重点[95].
在像素级的识别方面,作物病害图像识别常使用语义分割和实例分割2种方法. 通过分割网络的处理,可以准确地识别每个像素点所在位置、所属类别以及相应的几何属性,能够更深入地了解病害的形态特征,进一步识别和分析病害的严重程度,从而极大地提高作物病害识别的准确性和细节表现. 目前常用的分割网络主要包括全卷积网络FCN[102]、Mask R-CNN[103]和Transformer[104],同时一些学者围绕网络模型的选择和改进开展了不少研究工作[105-106].
随着研究的深入,近年来出现了一批将深度学习和移动终端相结合的轻量级作物病害识别系统,可安装在移动终端供用户使用[107-108]. 同时边缘计算技术因其计算过程通过本地而无需与云端交互这一特点,较好地解决了作物病害识别时间延迟过长的瓶颈,促进了基于移动设备的作物病害识别研究[109].
深度学习之所以能有强大的特征表达优势,其必要条件之一是需具备大规模的样本数据进行训练和优化[110]. 但由于农业生产环境的复杂性以及不同作物不同病害发生频率的差异,作物病害图像样本数据规模普遍相对偏小且不同类型的病害数据数量存在严重的不均衡,而训练数据不足容易使模型出现过拟合[110],从而影响模型的泛化识别效果. 除了空间几何变换法和添加噪声法等常用数据增强方法,近年来对抗式生成网络GANs[111]的引入有助于增加训练样本的多样性. 除此之外,迁移学习的出现一定程度上缓解了训练数据不足的问题,其本质是将某个任务上学习到的知识应用到另一个不同但相关的任务[112],如Chen等[113]利用在大型公开图像数据集ImageNet上预训练好的VGGNet模型,以玉米和水稻为研究对象,在田间实际环境下分别采集了5种水稻病害和4种玉米病害的RGB图像,分别计500幅和466幅,利用预训练好的模型加以微调进行迁移学习,平均识别准确率达到92%. 此外迁移学习还在葡萄、番茄等作物病害识别中有着良好表现,证明了其在基于深度学习的作物病害识别方面的有效性[114-115].
目前基于深度学习的作物病害图像识别研究出现了多种类型的方法,各类方法均存在不同程度的优劣. 以卷积神经网络为代表的作物病害图像分类由于能够自动提取图像中的关键特征,更好地捕捉病害表征丰富的细节特点,极大地提高了病害识别的效率和准确率,尤其是病害部位占据图像主要空间时具有很高的准确率,成为基于深度学习的作物病害图像识别主流方法之一,但其只能进行病害类型及等级的判断,无法自动检测出作物病害侵染区域及其准确位置. 单阶段和两阶段目标检测算法在自然生产条件下对一些作物病害的位置定位和识别方面已取得了较好的检测效果,其中两阶段检测算法在精度方面略有优势,单阶段检测算法在保证精度的同时拥有更好的识别速度. 但目前的目标检测也存在一些问题:一是缺乏统一的病斑边界框划定标准,导致不同研究的病斑边界框标识混乱,某些研究的可靠性有待验证;二是复杂自然场景下的病害目标检测研究还需提升,尤其是阴影、遮挡、复杂背景、小病斑等叠加的密集场景,小目标病害检测仍待进一步深入. 像素级识别虽然在复杂场景识别定位方面更具优势,能获得更详细的病害信息,但数据集构建成本高、时间长,同时无论是语义分割还是实例分割,其使用的网络结构对输入数据规范化都有较高的要求. 此外,深度学习算法的性能受作物病害数据质量及规模、计算资源等因素的影响,根据不同应用场景和实际需求,合理选择适用的模型、优化策略及数据增强技术有助于提升病害的识别效果.
-
突现性较高的关键词是某个时期内频次变化率高的词,能反映其研究热点前沿[17]. 为了解作物病害图像识别不同时期研究热点的变化,利用CiteSpace对2002-2022年间的文献进行突现分析,共筛选出跨越1年以上的突现词165个,合并相近意思的关键词及短语后,最终筛选出突现强度高的Top 20个关键词(表 8). 可以看出,在研究的前期由于发表论文数量少,突现关键词少且突现强度也较低,研究主要围绕传统的图像分析技术进行作物病害识别诊断. 从2012年开始,“叶片”“分类”“特征选择”“支持向量机”“遥感”“高光谱成像”“人工智能”“精准农业”等突现词大量出现,说明作物病害图像识别研究的热点发生了很大变化,面向精准农业发展成为作物病害识别研究的核心主题. 随着人工智能技术的进步,对图像病害特征进行提取并在此基础上利用分类器进行分类的机器学习方法成为这一时期研究的重点,与此同时利用光学遥感监测进行作物病害区分与判别也受到广泛重视,热度一直持续至今. 伴随着机器学习的发展,深度学习取得重大突破,2019年后“深度学习”和“卷积神经网络”成为新的突现关键词且突现强度远高于其他突现词,将结合图像处理的深度学习技术应用于作物病害图像自动识别成为新的研究焦点,同时面向智慧农业的发展需求也为其提供了更多的应用场景和发展动力,无人机作为作物数据采集的主要方式在这一时期也是较为突出的热点. 突现性距今最近的关键词是“数据增强”(突现时间2021-2022年)、“目标检测”(突现时间2021-2022年)和“边缘计算”(突现时间2021-2022年),表明如何解决作物病害样本数据规模有限的困难,以及提升复杂自然环境下小目标病害检测与细粒度识别的准确率是当前作物病害图像识别研究的热点前沿. 除此之外,将图像识别技术与边缘计算相结合,以实现在农田等边缘环境中对作物病害的快速检测和识别也是目前作物病害图像识别研究的热点前沿.
2.1. 年度发文量及变化趋势
2.2. 研究力量分布
2.2.1. 国家/地区分布
2.2.2. 核心机构分布
2.2.3. 核心出版物与核心作者分析
2.3. 学科分布
2.4. 研究热点及其变化
2.4.1. 高频关键词分析
2.4.2. 关键词突现分析
-
本文以Web of Science核心数据集2002-2022年累计20年作物病害图像识别领域的1 056篇期刊论文为研究对象,利用文献计量的方法,从文献数量的年变化趋势、主要研究力量、学科分布以及研究热点及其变化等方面,分析研究了当前作物病害图像识别研究的现状与趋势,得到如下结论:
1) 作物病害图像识别研究在过去20年呈明显上升趋势,2002-2011年为初始期,2012-2018年为增长期,2019年后高速发展,至2022年12月间发文量占总发文量的83.71%,与人工智能第三次发展浪潮的时间节点高度吻合,已成为智慧农业发展研究的重要组成部分.
2) 中国、美国、印度、德国等国家发文数量最多,整体而言各国之间均存在较为密切的交流与合作,其中中美之间合作最为密切. 发文量前10的机构中有6家来自中国,展现出中国科研结构的整体优势,德国波恩大学总被引频次、篇均被引频次和h指数均为世界第1,体现出很高的科研成果质量. MAHLEIN A K、HUANG W J和KHAN M A是发文量排在前3的核心作者.
3) Computers and Electronics in Agriculture、Frontiers in Plant Science和Remote Sensing是作物病害图像识别研究领域主要来源出版物,其中Computers and Electronics in Agriculture发文量占领域发文总量的11.74%,总被引频次、篇均被引频次和h指数均排在第1位. 学科研究领域涉及计算机科学、农学、植物科学、工程、环境生态学、遥感等,体现出明显的综合性和交叉性特点.
4) 根据高频关键词统计、共现密度图谱和突现词分析并结合相关文献阅读发现,作物病害图像识别研究的核心内容为作物病害图像数据获取、基于机器学习的作物病害图像识别以及基于深度学习的作物病害图像识别3个方面. 其中作物病害图像数据获取主要聚焦于手持式设备获取、遥感、高通量作物表型数据获取平台和作物病害公开数据集. 基于机器学习的作物病害图像识别重点关注特征选取和分类器的选择. 近年来研究热点逐渐过渡到基于深度学习的作物病害图像识别,并从图像级分类向目标级和像素级检测深入,同时为缓解作物病害图像样本数据量不足的问题,数据增强技术和迁移学习成为研究者关注的重要内容. 除此之外将图像识别技术与边缘计算相结合,以实现在农田等边缘环境中对作物病害的快速检测和识别是目前作物病害图像识别研究的热点前沿.
-
随着计算机视觉、光学、物联网和遥感技术的进步,基于图像的作物病害自动识别发展迅速,在作物病害检测领域展现出强大的潜力和广阔的应用前景,为作物病虫害防治提供了重要的技术支持和解决方案,但由于农业生产条件及病害本身特点的复杂性,研究中仍然存在一些尚未解决的问题,有鉴于此,本文提出以下建议和展望:
1) 构建基于生成式大模型的大规模作物病害数据集. 目前结合图像处理的深度学习是作物病害图像识别研究的主要技术趋势,但深度学习取得高准确率的前提条件之一是需要大规模的样本数据来进行训练和优化,然而农业生产环境的复杂性导致数据的采集有一定困难且总体成本较高,同时不同作物不同病害发生频率存在较大的差异,使得作物病害图像样本数据规模普遍相对偏小且不同类型的病害数据数量存在严重的不均衡. 除了鼓励研究人员、农业技术人员和相关专家共享各自研究工作中获取的数据,积极打造作物病害数据共享资源平台外,生成式人工智能特别是生成式大模型的技术突破为从根本上解决作物病害图像数据规模问题提供了契机,构建基于生成式大模型的大规模作物病害数据集可能是未来作物病害图像识别研究最重要的方向之一.
2) 加强多模态数据融合. 病害胁迫造成作物生理机制与形态特征发生变化,但不同病害在不同作物表面经常会有相似的症状,因此利用RGB数码图像进行具有相似症状表征的不同病害识别一直是领域内的难题. 光谱数据具有光谱连续性的特点,由于病害胁迫会影响作物的光谱特征,使得利用光谱数据实现相似性状表征的不同病害识别成为可能. 然而不同病害同一时期可能会出现相同的光谱特征,导致“同谱异物”现象的发生,使得仅利用单一光谱数据容易导致误判,因此未来须加强重要作物病害多模态数据融合,从而为科学判断不同病害在检测中表现出的表征和光谱差异性提供依据,提高复杂条件下作物病害的识别准确度.
3) 提升模型的可解释性和泛化性. 作为目前作物病害图像识别研究主要技术趋势的深度学习,虽然在病害识别准确率方面展现出很大的优势,但深度学习的“黑箱”特点导致模型的可解释性差,使得识别结果及据此做出的决策可信度受到挑战,因此加强模型的可解释性研究,提高模型的透明度和信任度是后续研究应关注的重点之一. 此外,目前不少在既定数据集上表现优异的模型泛化性有限,很难应对复杂自然环境下的识别要求,使得模型真实应用比较困难,如何提升模型的泛化能力,使其能真正应用于实际农业生产环境,更好地满足智能农情监测实际需要是研究人员未来应关注的重要内容.
4) 开展作物病害实时监测识别. 当前大部分作物病害识别研究大都聚焦于静态图像,缺乏长时间序列的高时间分辨率监测成果,但作物病害从发病到凋枯直至死亡普遍时间较短,低时间分辨率尺度的研究很难满足对现有病情发展的精准监测. 由于航空及无人机技术等的进步,病害的监测识别范围已从田间与实验室扩展到农户农场乃至区域尺度,随着智慧农业的快速发展,农业物联网、新型传感器、空天地遥感技术日趋成熟,初步形成了立体化、全方位的观测体系,这为实现作物生长状况的实时监测识别提供了可能. 因此未来应进一步加强与农业基础理论的结合,在对图像分析基础上,充分考虑作物生长规律以及病原生物学特性等因素,结合不同作物病害发病周期开发实时监测识别产品,从而及时发现新的染病植株并识别出不同病害严重度,这对病情及治理的精准把控和对新发病情“早发现、早防治”具有重要意义.