基于改进YOLOv8算法对被遮挡柑橘的识别与定位优化

王元昊; 娄欢欢; 罗红品; 付兴兰; 李光林

doi:10.13718/j.cnki.xdzk.2025.02.015

基于改进YOLOv8算法对被遮挡柑橘的识别与定位优化

西南大学工程技术学院，重庆 400715

基金项目: 国家自然科学基金项目(31971782)；重庆市科委产业化重点专项(cstc2018jszx-cyzdX0051)

详细信息

作者简介:
王元昊，硕士研究生，主要从事智能农业装备研究 .

通讯作者: 李光林，博士，教授，博士研究生导师

中图分类号: TP391.41

Optimization of Identification and Localization of Occluded Citrus Based on Improved YOLOv8 Algorithm

College of Engineering and Technology, Southwest University, Chongqing 400715, China

摘要:
针对果园环境中柑橘果实相互重叠和被枝叶遮挡，导致机器视觉识别柑橘果实与定位目标柑橘空间位置难度较大的问题，提出了一种基于YOLOv8-SAM的改进算法。通过增加BAM(Bottlenet Attention Module)注意力机制提高模型对被遮挡柑橘的识别准确率，运用SAM(Segment Anything Model)算法对被遮挡柑橘轮廓形状进行识别，并运用边缘检测法结合双目立体相机三维稠密深度点云得到被遮挡柑橘有效轮廓边，使用最小二乘法拟合出被遮挡柑橘的完整轮廓以确定目标柑橘果实更精确的空间坐标位置。试验结果表明：该算法可以准确识别并分离目标柑橘果实，同时更精确地定位柑橘果实空间坐标。改进的YOLOv8-SAM算法在果园环境中对被遮挡柑橘果实的识别平均精度达到91.1%，对被遮挡柑橘形心空间坐标的平均定位误差相比传统定位方法减少了16.22 mm，平均果径误差降低了7.99%，可为柑橘采摘机器人对重叠与被遮挡果实的准确识别提供参考。
- 柑橘采摘 /
- 机器视觉 /
- 空间定位 /
- 轮廓重建 /
- 遮挡果实 /
- 图像处理
Abstract:
In response to the challenges for machine vision to identify citrus fruit and locate the spatial position of target citrus in orchards due to overlapping fruit and occlusion by branches and leaves, a modified algorithm based on YOLOv8-SAM was proposed. The model's accuracy in identifying occluded citrus fruit was improved by adding BAM (Bottlenet Attention Module) attention mechanism. The contour shape of occluded citrus fruit was identified using SAM (Segment Anything Model) algorithm, and effective contour edges were obtained by combining edge detection with a binocular camera's 3D dense point cloud. The complete contour of the occluded citrus fruit was fitted using least squares to determine the more precise spatial coordinate position of the target citrus fruit. The experimental results show that the algorithm can accurately identify and separate the target citrus fruit, and more precisely locate the spatial coordinate of the citrus fruit. The average identification accuracy of the modified YOLOv8-SAM algorithm for occluded citrus fruit in the orchard environment is 91.1%, and the average spatial coordinate positioning error of the citrus fruit's center compared to traditional positioning methods is reduced by 16.22 mm, and the average fruit diameter error is reduced by 7.99%. This algorithm can provide reference for accurate identification of overlapping and occluded citrus fruit by citrus harvesting robots.
- citrus picking /
- machine vision /
- spatial positioning /
- contour reconstruction /
- occluded fruit /
- image processing .

图 1 柑橘图像数据

下载: 全尺寸图片幻灯片

图 2 YOLOv8网络模型结构

下载: 全尺寸图片幻灯片

图 3 BAM模块结构图

下载: 全尺寸图片幻灯片

图 4 SAM架构

下载: 全尺寸图片幻灯片

图 5 Ostu法与SAM算法对比

下载: 全尺寸图片幻灯片

图 6 各坐标系转化示意图

下载: 全尺寸图片幻灯片

图 7 柑橘果实直径测量相对误差

下载: 全尺寸图片幻灯片

图 8 拟合效果图

下载: 全尺寸图片幻灯片

图 9 原始YOLOv8网络与改进YOLOv8网络模型效果对比

下载: 全尺寸图片幻灯片

图 10 自然场景下柑橘果实不同遮挡情况测试图像

下载: 全尺寸图片幻灯片

图 11 自然场景下被遮挡柑橘果实定位过程及结果

下载: 全尺寸图片幻灯片

图 12 果园环境中算法改进前后运行结果

下载: 全尺寸图片幻灯片

表 1 模型相关参数

参数	数值	参数	数值
图像尺寸	640×640	最大学习率	0.01
优化器	Adam	动量	0.9
Batch Size	32	Epoch	200

下载: 导出CSV

表 2 不同注意力模块对比试验

注意力模块	P/%	R/%	m_AP/%
无	86.5	85.9	89.3
BoTNet	87.0	85.7	89.4
SimAM	87.4	86.2	89.6
BAM	88.4	87.4	91.1
注：P、R、m_AP分别为准确率、召回率和平均精度均值。下同。

下载: 导出CSV

表 3 不同网络模型的检测性能对比

模块	P/%	R/%	m_AP/%
Faster RCNN	83.6	82.6	84.6
YOLOv5	85.4	84.3	88.9
YOLOv8	86.5	85.9	89.3
改进YOLOv8	88.4	87.4	91.1

下载: 导出CSV

表 4 算法定位误差与果径误差比较

类型	未改进算法		改进算法
类型	定位误差/mm	果径误差/%	定位误差/mm	果径误差/%
a类	1.35	0.97	1.31	0.94
b类	16.49	7.75	2.36	1.01
c类	21.63	10.48	3.31	1.25
平均	13.16	6.40	2.33	1.07

下载: 导出CSV

[1]	潘一凡, 刘永忠, 黄钰轩, 等. 我国柑橘栽培管理技术现状调查和发展思考[J]. 华中农业大学学报, 2023, 42(4): 140-149.
[2]	吕佳, 李帅军, 曾梦瑶, 等. 基于半监督SPM-YOLOv5的套袋柑橘检测算法[J]. 农业工程学报, 2022, 38(18): 204-211. doi: 10.11975/j.issn.1002-6819.2022.18.022
[3]	黄彤镔, 黄河清, 李震, 等. 基于YOLOv5改进模型的柑橘果实识别方法[J]. 华中农业大学学报, 2022, 41(4): 170-177.
[4]	李欣, 王玉德. 基于颜色模型和阈值分割的有遮挡的柑橘果实识别算法[J]. 计算技术与自动化, 2022, 41(2): 136-140.
[5]	宋怀波, 尚钰莹, 何东健. 果实目标深度学习识别技术研究进展[J]. 农业机械学报, 2023, 54(1): 1-19.
[6]	刘妤, 刘洒, 杨长辉, 等. 基于双目立体视觉的重叠柑橘空间定位[J]. 中国农业科技导报, 2020, 22(9): 104-112.
[7]	刘振宇, 丁宇祺. 自然环境中被遮挡果实的识别方法研究[J]. 计算机应用研究, 2020, 37(S2): 333-335, 339.
[8]	李立君, 阳涵疆. 基于改进凸壳理论的遮挡油茶果定位检测算法[J]. 农业机械学报, 2016, 47(12): 285-292, 346.
[9]	李颀, 强华. 基于双目视觉与深度学习的番茄本体特征检测系统[J]. 南方农业学报, 2020, 51(1): 237-244.
[10]	吴德刚, 赵利平, 陈乾辉. 遮挡苹果目标的三点定位算法研究[J]. 黄河科技学院学报, 2022, 24(8): 40-45.
[11]	刘忠意, 魏登峰, 李萌, 等. 基于改进YOLOv5的橙子果实识别方法[J]. 江苏农业科学, 2023, 51(19): 173-181.
[12]	周宏平, 金寿祥, 周磊, 等. 基于多模态图像的自然环境下油茶果识别[J]. 农业工程学报, 2023, 39(10): 175-182.
[13]	林耀海, 吕钟亮, 杨长才, 等. 自然场景图像中的重叠蜜柚识别及试验[J]. 农业工程学报, 2021, 37(24): 158-167.
[14]	王小荣, 许燕, 周建平, 等. 基于改进YOLOv7的复杂环境下红花采摘识别[J]. 农业工程学报, 2023, 39(6): 169-176.
[15]	VARGHESE R, SAMBATH M. YOLOv8: A Novel Object Detection Algorithm with Enhanced Performance and Robustness[C] //2024 International Conference on Advances in Data Engineering and Intelligent Computing Systems (ADICS), April 18-19, 2024, Chennai, India. IEEE, 2024: 1-6.
[16]	QI J T, LIU X N, LIU K, et al. An Improved YOLOv5 Model Based on Visual Attention Mechanism: Application to Recognition of Tomato Virus Disease[J]. Computers and Electronics in Agriculture, 2022, 194: 106780.
[17]	张俊宁, 毕泽洋, 闫英, 等. 基于注意力机制与改进YOLO的温室番茄快速识别[J]. 农业机械学报, 2023, 54(5): 236-243.
[18]	KIRILLOV A, MINTUN E, RAVI N, et al. Segment Anything[C] //2023 IEEE/CVF International Conference on Computer Vision (ICCV), 2023: 3992-4003.
[19]	SILWAL A, DAVIDSON J R, KARKEE M, et al. Design, Integration, and Field Evaluation of a Robotic Apple Harvester[J]. Journal of Field Robotics, 2017, 34(6): 1140-1159.
[20]	LIN G C, TANG Y C, ZOU X J, et al. Color-, Depth-, and Shape-Based 3D Fruit Detection[J]. Precision Agriculture, 2020, 21(1): 1-17.
[21]	WU G, LI B, ZHU Q B, et al. Using Color and 3D Geometry Features to Segment Fruit Point Cloud and Improve Fruit Recognition Accuracy[J]. Computers and Electronics in Agriculture, 2020, 174: 105475.
[22]	陈志健, 伍德林, 刘路, 等. 复杂背景下油茶果采收机重叠果实定位方法研究[J]. 安徽农业大学学报, 2021, 48(5): 842-848.
[23]	刘德儿, 朱磊, 冀炜臻, 等. 基于RGB-D相机的脐橙实时识别定位与分级方法[J]. 农业工程学报, 2022, 38(14): 154-165.
[24]	WANG Y W, CHEN Y F, WANG D F. Recognition of Multi-Modal Fusion Images with Irregular Interference[J]. PeerJ Computer Science, 2022, 8: e1018.
[25]	张勤, 庞月生, 李彬. 基于实例分割的番茄串视觉定位与采摘姿态估算方法[J]. 农业机械学报, 2023, 54(10): 205-215.
[26]	GIRSHICK R, DONAHUE J, DARRELL T, et al. Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation[C] //2014 IEEE Conference on Computer Vision and Pattern Recognition, June 23-28, 2014, Columbus, OH, USA. IEEE, 2014: 580-587.

图( 12) 表( 4)

计量

文章访问数: 7089
HTML全文浏览数: 7089
PDF下载数: 179
施引文献: 0

全文HTML

开放科学（资源服务）标识码（OSID）：
我国是世界第一大柑橘生产国，约占世界柑橘产量的三分之一^[1]。据国家统计局和联合国粮食及农业组织统计，2020年我国柑橘种植面积超过2.8×10⁶ hm²，产量超过5×10⁷ t，分布于全国19个省(自治区、直辖市)^[2]。目前，柑橘果园仍采用人工采摘的方式收获成熟柑橘果实，采摘过程耗时长，劳动强度大，人工成本高，如何实现自动化采摘代替人工采摘作业成为柑橘果园管理中亟待解决的问题^[3]。

近年来，随着机器视觉和人工智能技术的迅猛发展，新的图像处理与分析方法层出不穷^[4]。然而在自然环境下，柑橘多个果实相互遮挡、重叠，以及果实部分受枝叶遮挡的现象非常严重，给目标果实的检测识别与空间定位带来了很大的困难^[5]。图像分割技术在农业生产方面的应用吸引了众多学者的关注^[6]。刘振宇等^[7]提出了一种凝聚层次聚类算法用于检测被遮挡果实，将圆心点集作为改进型凝聚层次聚类分类器的输入，并对输出结果进行圆拟合实现遮挡果实的识别，对未被遮挡的果实识别率高达93.53%，但对被大面积遮挡的果实识别效果较差，仅为82.71%。李立君等^[8]基于改进的凸壳理论对被遮挡油茶果进行定位，对被遮挡油茶果的正确识别率达到了93.21%，平均分割误差和平均重合度分别为5.53%和93.43%。李颀等^[9]提出了基于YCbCr颜色空间模型和Otsu阈值分割技术，应用边缘检测法和凸包算法提取被遮挡果实的轮廓特征来定位目标果实，果实平均检出率达到90.48%。吴德刚等^[10]提出了一种利用K-means聚类方法分离被遮挡的苹果目标与背景，采用Canny算法和凸壳理论相融合的方法获得苹果被遮挡部分真实轮廓，运用三点定圆理论实现了被遮挡苹果整体目标的边缘定位，平均重叠系数为88.921%。通过对上述文献的分析可以看出，现有算法多对被遮挡果实的二维图像进行识别，虽具有较高的准确度，但未结合果实的三维空间信息，无法获得被遮挡果实的空间坐标，难以对果实采摘作业的空间标定提供实质性的帮助。

因此，为解决柑橘果实受枝叶与果实遮挡严重，难以对目标果实进行准确空间定位的问题，本文提出了一种使用双目立体相机三维稠密深度点云并基于YOLOv8-SAM算法对目标柑橘进行识别与空间定位的方法，同时运用边缘检测法提取被遮挡果实的轮廓特征，对其进行椭圆拟合补完，测算果实直径并推断果实形心空间位置，实现对被遮挡柑橘果实的准确分割与精确空间定位，为柑橘采摘的空间标定提供有效帮助。

4. 结论

针对柑橘果实相互重叠与被枝叶遮挡导致的对机器视觉定位目标柑橘空间位置造成误差的问题，本文提出了一种基于YOLOv8-SAM算法对被遮挡柑橘的位置形状进行识别，并运用边缘检测法结合双目立体相机三维稠密深度点云得到被遮挡柑橘的有效轮廓边，使用最小二乘法拟合出被遮挡柑橘的完整轮廓以确定目标柑橘更精确的空间坐标位置。主要结论如下：

1) 提出一种改进的YOLOv8网络结构，在骨干网络模块中加入BAM注意力机制模块，使其对重叠果实与被枝叶遮挡果实有更好的识别效果。改进网络在果园环境下的柑橘果实检测中达到了88.4%的准确率、87.4%的召回率以及91.1%的平均精度均值，相较于原始的YOLOv8网络模型，改进的YOLOv8网络在果实重叠与被枝叶遮挡环境下的识别准确率提高了1.9个百分点，平均精度均值提升了1.8个百分点。

2) 提出一种对被遮挡柑橘果实轮廓的重建方法，基于图像分割与深度图像数据对被遮挡柑橘果实有效轮廓边进行补完，并获得果实形心空间坐标，利用该方法获得的重建轮廓与实际果实轮廓重合度高。对未被遮挡或被轻度遮挡的果实，重合度均值达到93.04%；对被枝叶遮挡或果实重叠的情况，重合度均值达到86.73%。

3) 使用本文算法模型对目标柑橘果实的空间位置与果径进行识别时，对形心位置定位的平均误差减少了16.22 mm，平均果径误差降低了7.99%，证明了本文提出的改进算法能够较为准确地识别被遮挡柑橘果实目标并对其进行定位与果径测量，验证了本文算法用于自动化柑橘采摘的可行性，为柑橘果实及相似水果在自然环境下的识别和定位提供了参考，为水果采摘机器人的研制提供了支撑。

参考文献 (26)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

留言板

基于改进YOLOv8算法对被遮挡柑橘的识别与定位优化

西南大学工程技术学院，重庆 400715

作者简介:
王元昊，硕士研究生，主要从事智能农业装备研究 .

通讯作者: 李光林，博士，教授，博士研究生导师

Optimization of Identification and Localization of Occluded Citrus Based on Improved YOLOv8 Algorithm

College of Engineering and Technology, Southwest University, Chongqing 400715, China

计量

基于改进YOLOv8算法对被遮挡柑橘的识别与定位优化

通讯作者: 李光林，博士，教授，博士研究生导师

作者简介: 王元昊，硕士研究生，主要从事智能农业装备研究
西南大学工程技术学院，重庆 400715

English Abstract

Optimization of Identification and Localization of Occluded Citrus Based on Improved YOLOv8 Algorithm

Corresponding author: LI Guanglin

全文HTML

1.1. 数据集构建

1.2. 试验环境与训练策略

1.3. 评价指标

2.1. 改进的YOLO目标检测与分割算法

2.2. 双目视觉空间定位

2.3. 常见的空间定位方法

2.4. 优化后的空间定位算法

3.1. 改进后的网络模型效果

3.1.1. 注意力对比试验

3.1.2. 不同模型对比试验

3.2. 检测效果对比

3.2.1. 果实识别效果

3.2.2. 拟合效果

3.2.3. 定位检测效果

目录

留言板

基于改进YOLOv8算法对被遮挡柑橘的识别与定位优化

西南大学 工程技术学院，重庆 400715

作者简介: 王元昊，硕士研究生，主要从事智能农业装备研究 .

通讯作者: 李光林，博士，教授，博士研究生导师

Optimization of Identification and Localization of Occluded Citrus Based on Improved YOLOv8 Algorithm

College of Engineering and Technology, Southwest University, Chongqing 400715, China

计量

出版历程

基于改进YOLOv8算法对被遮挡柑橘的识别与定位优化

通讯作者: 李光林，博士，教授，博士研究生导师

作者简介: 王元昊，硕士研究生，主要从事智能农业装备研究 西南大学 工程技术学院，重庆 400715

English Abstract

Optimization of Identification and Localization of Occluded Citrus Based on Improved YOLOv8 Algorithm

Corresponding author: LI Guanglin

全文HTML

1.1. 数据集构建

1.2. 试验环境与训练策略

1.3. 评价指标

2.1. 改进的YOLO目标检测与分割算法

2.2. 双目视觉空间定位

2.3. 常见的空间定位方法

2.4. 优化后的空间定位算法

3.1. 改进后的网络模型效果

3.1.1. 注意力对比试验

3.1.2. 不同模型对比试验

3.2. 检测效果对比

3.2.1. 果实识别效果

3.2.2. 拟合效果

3.2.3. 定位检测效果

目录

西南大学工程技术学院，重庆 400715

作者简介:
王元昊，硕士研究生，主要从事智能农业装备研究 .

作者简介: 王元昊，硕士研究生，主要从事智能农业装备研究
西南大学工程技术学院，重庆 400715