基于YOLOv8的驾驶员分心行为实时检测研究

潘健东; 范超杰; 姜卓希; 邓涵文; 伍贤辉; 彭勇

doi:10.13718/j.cnki.xdzk.2025.08.004

基于YOLOv8的驾驶员分心行为实时检测研究

中南大学交通运输工程学院，长沙 410075

基金项目: 国家自然科学基金项目(U24B20123)；湖南省科技创新计划项目(2022RC3044)

详细信息

作者简介:
潘健东，硕士研究生，主要从事机器视觉与深度学习研究 .

中图分类号: TP183; TP391.4; U492.8

Real-Time Detection of Driver Distraction Behavior Based on YOLOv8

School of Traffic & Transportation Engineering, Central South University, Changsha 410075, China

摘要:
分心驾驶行为会加大交通事故发生概率，威胁到驾驶员生命安全。针对现有公开驾驶分心行为数据普遍缺乏职业驾驶员群体的不足，构建了面向职业驾驶员群体的分心驾驶行为数据集。YOLO模型凭借其快速的检测性能，在实时目标检测领域得到广泛应用。构建了一种基于YOLOv8的分心驾驶行为检测算法。首先，将CBAM注意力机制集成进YOLOv8n主干网络中，增强模型的全局特征提取能力。其次，在颈部网络中，将FasterBlock模块与C2f模块融合，形成C2f-FasterBlock模块，并集成于YOLOv8模型中。在自建的驾驶场景数据集的实验结果表明，改进的YOLOv8n算法显著提高了分心驾驶行为检测精度，平均精度比原本的YOLOv8n高出4.88%。
- 职业驾驶员分心行为数据集 /
- YOLOv8 /
- 分心驾驶 /
- 深度学习
Abstract:
Distracted driving behavior increases the probability of traffic accidents and threatens drivers' safety. To address the lack of professional driver groups in existing public driving distraction behavior datasets, this study constructs a distracted driving behavior dataset specifically targeting professional drivers. The YOLO model has gained widespread application in real-time object detection due to its rapid detection capabilities. This paper develops an improved distracted driving detection algorithm based on YOLOv8. Firstly, the Convolutional Block Attention Module attention mechanism was integrated into the backbone network of YOLOv8n to enhance the model's global feature extraction capability. Secondly, in the neck network, the FasterBlock module was combined with the C2f module to form a C2f-FasterBlock module, which was subsequently integrated into the YOLOv8 architecture. Experimental results with our self-built driving scenario dataset demonstrate that the enhanced YOLOv8n algorithm significantly improved detection accuracy for distracted driving behaviors, achieving a 4.88% higher mean average precision compared to the original YOLOv8n model.
- professional driver distraction behavior dataset /
- YOLOv8 /
- distracted driving /
- deep learning .

图 1 数据采集摄像头位置示意

下载: 全尺寸图片幻灯片

图 2 参与实验志愿者职业分布

下载: 全尺寸图片幻灯片

图 3 志愿者年龄、性别及职业驾龄分布

下载: 全尺寸图片幻灯片

图 4 4类分心驾驶行为视频片段数量统计图

下载: 全尺寸图片幻灯片

图 5 职业驾驶员分心驾驶行为数据集示例

下载: 全尺寸图片幻灯片

图 6 改进后的YOLOv8模型结构

下载: 全尺寸图片幻灯片

图 7 CBAM结构

下载: 全尺寸图片幻灯片

图 8 FasterBlock结构

下载: 全尺寸图片幻灯片

图 9 驾驶分心行为检测效果图

下载: 全尺寸图片幻灯片

表 1 职业驾驶员分心驾驶行为数据集张

摄食	吸烟	使用手机	饮水	共计
1 428	1 010	8 100	977	11 515

下载: 导出CSV

表 2 分心驾驶行为数据集分类统计张

类别	训练集	验证集	测试集
摄食	1 000	286	142
吸烟	1 007	202	101
使用手机	1 134	324	162
饮水	984	195	98
共计	4 125	1 007	503

下载: 导出CSV

表 3 驾驶分心行为数据集比对

数据集	分型行为种类/种	标注样本总量/个	实验人群职业	志愿者数量/个
SFDDD数据集^[23]	10	28 991	普通驾驶员	25
QIN数据集^[17]	6	52 461	普通驾驶员	6
100-Driver数据集^[22]	21	470 208	普通驾驶员与取业驾驶员	100
定制数据集^[25]	4	6 400	普通驾驶员	16
本研究数据集	4	5 635	职业驾驶员	99

下载: 导出CSV

表 4 模型对比实验

模型	检测精度/%				mAP/ %	mAP@0.5/ %	R/%	F1/%
模型	摄食	吸烟	使用手机	饮水	mAP/ %	mAP@0.5/ %	R/%	F1/%
YOLOv8n	80.98	78.2	86.42	78.57	81.04	85.38	77.55	81.28
本研究模型	84.51	84.16	91.34	83.67	85.92	90.16	78.52	83.94

下载: 导出CSV

表 5 消融实验

YOLOv8n	CBAM	C2f-FasterBlock	mAP@0.5/%	g/G	p/MB
√			85.38	8.2	3.0
√	√		87.13	8.3	3.1
√		√	88.71	7.1	2.5
√	√	√	90.16	8.9	3.1

下载: 导出CSV

[1]	BEANLAND V, FITZHARRIS M, YOUNG K L, et al. Driver Inattention and Driver Distraction in Serious Casualty Crashes: Data from the Australian National Crash In-Depth Study [J]. Accident Analysis & Prevention, 2013, 54: 99-107.
[2]	WICKENS C D. Multiple Resources and Performance Prediction [J]. Theoretical Issues in Ergonomics Science, 2002, 3(2): 159-177.
[3]	KABER D B, LIANG Y L, ZHANG Y, et al. Driver Performance Effects of Simultaneous Visual and Cognitive Distraction and Adaptation Behavior [J]. Transportation Research Part F: Traffic Psychology and Behaviour, 2012, 15(5): 491-501.
[4]	PENG Y, LOU X, WANG H G, et al. Driving Behavior in Hazardous Situations: The Interplay between Risk Scenarios and Dimensional Emotions [J]. Transportation Research Part F: Traffic Psychology and Behaviour, 2024, 107: 695-709.
[5]	BANERJEE A, PATHIVADA B K, HALEEM K, et al. Developing Distraction-Related Safety Performance Functions at Interchange Ramp Terminals in Kentucky [J]. Journal of Safety Research, 2025, 93: 66-78.
[6]	BIONDI F N, HORREY W J, DONMEZ B. Preface to the Special Issue on Assessment and Effectiveness of Driver Monitoring Systems [J]. Human Factors, 2024, 66(9): 2161-2165.
[7]	KASHEVNIK A, SHCHEDRIN R, KAISER C, et al. Driver Distraction Detection Methods: A Literature Review and Framework [J]. IEEE Access, 2021, 9: 60063-60076.
[8]	ZHANG J, WU Z C, LI F, et al. A Deep Learning Framework for Driving Behavior Identification on In-Vehicle CAN-BUS Sensor Data [J]. Sensors, 2019, 19(6): 1356.
[9]	顾清华, 殷书檀, 王丹, 等. 基于改进YOLOv8的矿卡司机疲劳驾驶检测[J]. 中国安全科学学报, 2025, 35(1): 60-66.
[10]	KHAN M A, NAWAZ T, KHAN U S, et al. IoT-Based Non-Intrusive Automated Driver Drowsiness Monitoring Framework for Logistics and Public Transport Applications to Enhance Road Safety [J]. IEEE Access, 2023, 11: 14385-14397.
[11]	FU S C, YANG Z H, MA Y, et al. Advancements in the Intelligent Detection of Driver Fatigue and Distraction: A Comprehensive Review [J]. Applied Sciences, 2024, 14(7): 3016.
[12]	XIANG G L, YAO S, WU X H, et al. Driver Multi-Task Emotion Recognition Network Based on Multi-Modal Facial Video Analysis [J]. Pattern Recognition, 2025, 161: 111241.
[13]	REDMON J, DIVVALA S, GIRSHICK R, et al. You Only Look Once: Unified, Real-Time Object Detection [C] //2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). New York: IEEE, 2016: 779-788.
[14]	GHAHREMANI A, ADAMS S D, NORTON M, et al. Detecting Defects in Solar Panels Using the YOLO V10 and V11 Algorithms [J]. Electronics, 2025, 14(2): 344.
[15]	WANG C Y, LIAO H M. YOLOv1 to YOLOv10: The Fastest and Most Accurate Real-Time Object Detection Systems [J]. APSIPA Transactions on Signal and Information Processing, 2024, 13(1): 20240058.
[16]	徐红梅, 杨浩, 李亚林, 等. 基于改进YOLO-Pose的复杂环境下拖拉机驾驶员关键点检测[J]. 农业工程学报, 2023, 39(16): 139-149.
[17]	LI R J, YU C D, QIN X R, et al. YOLO-SGC: A Dangerous Driving Behavior Detection Method with Multiscale Spatial-Channel Feature Aggregation [J]. IEEE Sensors Journal, 2024, 24(21): 36044-36056.
[18]	LI T, LOU X, YANG Z Q, et al. Clarifying the Impact of Engine Operating Parameters of Heavy-Duty Diesel Vehicles on NOx and CO2 Emissions Using Multimodal Fusion Methods [J]. Science of The Total Environment, 2024, 954: 176598.
[19]	NORDFJAERN T, J∅RGENSEN S H, RUNDMO T. Safety Attitudes, Behaviour, Anxiety and Perceived Control among Professional and Non-Professional Drivers [J]. Journal of Risk Research, 2012, 15(8): 875-896.
[20]	WOO S, PARK J, LEE J Y, et al. CBAM: Convolutional Block Attention Module [M] //FERRARI V, HEBERT M, SMINCHISESCU C, et al. Computer Vision. Cham: Springer International Publishing, 2018: 3-19.
[21]	CHEN J R, KAO S H, HE H, et al. Run, Don't Walk: Chasing Higher FLOPS for Faster Neural Networks [EB/OL]. (2023-03-15) [2024-04-30]. https://arxiv.org/abs/2303.03667v3.
[22]	WANG J, LI W J, LI F, et al. 100-Driver: A Large-Scale, Diverse Dataset for Distracted Driver Classification [J]. IEEE Transactions on Intelligent Transportation Systems, 2023, 24(7): 7061-7072.
[23]	ALJOHANI A A. Real-Time Driver Distraction Recognition: A Hybrid Genetic Deep Network Based Approach [J]. Alexandria Engineering Journal, 2023, 66: 377-389.
[24]	TURNBULL P R K, KHANAL S, DAKIN S C. The Effect of Cellphone Position on Driving and Gaze Behaviour [J]. Scientific Reports, 2021, 11(1): 7692.
[25]	WANG C, LIN M H, SHAO L, et al. MF-YOLO: A Lightweight Method for Real-Time Dangerous Driving Behavior Detection [J]. IEEE Transactions on Instrumentation and Measurement, 2024, 73: 5035213.

图( 9) 表( 5)

计量

文章访问数: 294
HTML全文浏览数: 294
PDF下载数: 249
施引文献: 0

全文HTML

开放科学（资源服务）标识码（OSID）：
分心驾驶行为是指驾驶员将驾驶资源从对安全驾驶至关重要的任务转移到与之竞争的次任务上^[1]，这种资源分配失衡会影响驾驶绩效^[2]，最终威胁到行车安全。驾驶绩效的核心资源依赖视觉注意力与中枢神经处理的协同机制。当驾驶员进行驾驶次任务(如操作手机)时，会触发双重干扰效应：视觉干扰通过转移视线焦点造成目视监测中断；认知干扰通过占用大脑核心运算资源削弱驾驶决策能力^[3]，从而提高遇到风险场景时决策反应时间，增加事故发生概率^[4]。根据美国国家公路交通管理局2023年公布的最新数据显示，2021年涉及分心驾驶的交通事故共造成3 522人死亡，较2020年增加了12.1%^[5]。因此实时监测驾驶员驾驶状态，并对检测到的分心驾驶行为给予必要的预警，对保障行车安全具有重要意义。

为降低因驾驶员因素而导致的事故发生率，相关领域的研究学者们对驾驶员监管系统(Driver Monitor System，DMS)展开了深入研究。DMS系统主要功能是检测驾驶员在执行驾驶任务时是否呈现异常状态，并在检测到分心状态时及时发出警告予以纠正^[6]。而在分心检测任务中，常用的检测算法有YOLO系列算法、ResNet与AlexNet等改进型卷积神经网络等^[7]。根据获取信息特征可分为两类：驾驶人生理信号和驾驶风格特征。其中，关于驾驶风格研究，主要通过分析外部传感器采集到的平均车速、横向加速度标准差、方向盘转速等信息进行驾驶员状态分析^[8]，该方法虽能够识别驾驶员状态，但识别效果容易受天气、道路状况等客观因素影响^[9]；关于驾驶员生理信号研究，根据生理信号获取方式可分为侵入式和非侵入式两类^[7]。侵入式是指通过智能手环、脑电帽等传感器进行持续、稳定的人机接触方式，获取生理信号^[10]。此种方法虽然识别准确率高，但在一定程度上影响驾驶员安全驾驶能力，因此更适合于实验研究和数据采集场合。非侵入式借助计算机视觉技术与深度学习实现，通过车载摄像头实时收集驾驶员面部特征、头部姿态特征、动作行为特征等个体信息与标定物品(手机、水瓶等影响安全驾驶物品)，并通过深度学习技术识别驾驶员动作和行为。此种方法成本低、准确率较高，不影响驾驶员安全驾驶，更适用于监控驾驶员^[11-12]。

随着深度学习目标检测算法的多次迭代更新，以YOLO(You Only Look Once)^[13]系列为代表的实时目标检测算法，广泛应用于目标识别领域中。目前Ultralytics公司推出的YOLOv11是YOLO系列目标检测算法的最新成果，在目标检测领域展现更加强大的性能^[14]。而除了目标检测外，YOLO系列算法在姿态估计领域也发挥着举足轻重的作用^[15]。因此越来越多的驾驶员状态检测方法选择了YOLO系列算法：为解决环境因素(光照、遮挡)导致的驾驶员检测精度低、误检等问题，文献[16]将Swin Transformer编码器、RepGFPN聚合网络等融合进YOLO-Pose，经实验测试，在复杂场景下仍能保持较高精度和鲁棒性；为提高模型在复杂场景下的识别准确性，文献[17]对YOLOv8颈部网络和SPPF模块进行改进，并集成全局注意力机制，增强YOLO算法在多尺度特征提取能力；文献[18]提出了一种多模态特征融合方法结合粒子群算法获取特征权重，通过捕捉时间依赖性，增强模型获取特征能力。

目前，深度学习在驾驶员分心行为检测方面取得重大进展，然而将现有的大部分研究成果应用在职业驾驶员群体上，会表现出明显的性能下降。这是因为大部分研究成果是基于普通驾驶员数据集训练得出，而职业驾驶员和普通驾驶员之间驾驶行为具有显著差异，进而产生跨领域适应问题^[19]，这会影响它们在职业驾驶员群体的应用。为了解决这些问题，本研究重新构建面向职业驾驶员群体的分心驾驶行为数据集。在YOLO模型选择上，为满足研究场景速度快、检测精度高的特点，选择参数量最小、检测速度最快的YOLOv8n作为本研究的基础模型。综上，本研究主要贡献包括：

1) 构建了一个专门面向职业驾驶员群体的分心驾驶行为数据集。该数据集从99名职业驾驶员日常驾驶过程中采集视频片段7 886条，累计时长约44 h，包含喝水、摄食、吸烟和使用手机4类典型分心行为，为后续分心驾驶行为识别研究提供了丰富、真实的数据基础。

2) 提出了一种基于YOLOv8的非接触式驾驶员分心驾驶行为检测方法。针对YOLOv8在多尺度特征提取能力不足以及检测速度较慢的问题，引入了卷积注意力模块(Convolutional Block Attention Module，CBAM)^[20]与快速块模块(FasterBlock)^[21]，对网络结构进行优化改进。实验结果表明，该方法有效提升了模型在职业驾驶员分心行为识别任务中的检测精度与实时性，同时具备无侵入、易部署等优势，更符合实际驾驶环境下的应用需求。

4. 结论

本研究针对现有分心驾驶行为数据集数据未涵盖职业驾驶员群体特点，构建以职业驾驶员群体为主的分心驾驶行为数据集。同时针对YOLOv8局限性，进行针对性的改进，提高了算法对驾驶员分心驾驶行为的识别精度与检测速度。具体改进包括将CBAM融合进主干网络以及用FasterBlock替换颈部网络C2f模块中的残差块。实验结果表明，改进后的模型检测性能得到有效提升。

但值得注意的是，与文献[17, 22-23]相比，改进后检测准确率仍有较大提升空间，主要原因在于本研究所构建的数据集规模较小：约为SFDDD数据集^[23]的$\frac{1}{5}$；约为QIN数据集^[17]的$\frac{1}{9}$；约为100-Driver数据集^[22]的$\frac{1}{83}$。因此，为进一步提高模型的准确性和泛化能力，未来的研究将重点扩大数据集规模，特别是针对职业驾驶员的分心驾驶行为进行大规模数据采集，这一举措有助于丰富分心驾驶行为数据集的多样性，提升模型对真实场景的适应性，为交通安全领域提供更为可靠的技术支持。

参考文献 (25)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

留言板

基于YOLOv8的驾驶员分心行为实时检测研究

中南大学交通运输工程学院，长沙 410075

作者简介:
潘健东，硕士研究生，主要从事机器视觉与深度学习研究 .

Real-Time Detection of Driver Distraction Behavior Based on YOLOv8

School of Traffic & Transportation Engineering, Central South University, Changsha 410075, China

计量

基于YOLOv8的驾驶员分心行为实时检测研究

作者简介: 潘健东，硕士研究生，主要从事机器视觉与深度学习研究
中南大学交通运输工程学院，长沙 410075

English Abstract

Real-Time Detection of Driver Distraction Behavior Based on YOLOv8

全文HTML

1.1. 数据集描述

1.2. 数据处理

1.3. 数据集对比

2.1. 基于改进YOLOv8n的分心驾驶行为检测模型

2.2. 融合CBAM的主干网络

2.3. C2f-FasterBlock模块

3.1. 试验模型评价指标

3.2. 模型性能分析

目录

留言板

基于YOLOv8的驾驶员分心行为实时检测研究

中南大学 交通运输工程学院，长沙 410075

作者简介: 潘健东，硕士研究生，主要从事机器视觉与深度学习研究 .

Real-Time Detection of Driver Distraction Behavior Based on YOLOv8

School of Traffic & Transportation Engineering, Central South University, Changsha 410075, China

计量

出版历程

基于YOLOv8的驾驶员分心行为实时检测研究

作者简介: 潘健东，硕士研究生，主要从事机器视觉与深度学习研究 中南大学 交通运输工程学院，长沙 410075

English Abstract

Real-Time Detection of Driver Distraction Behavior Based on YOLOv8

全文HTML

1.1. 数据集描述

1.2. 数据处理

1.3. 数据集对比

2.1. 基于改进YOLOv8n的分心驾驶行为检测模型

2.2. 融合CBAM的主干网络

2.3. C2f-FasterBlock模块

3.1. 试验模型评价指标

3.2. 模型性能分析

目录

中南大学交通运输工程学院，长沙 410075

作者简介:
潘健东，硕士研究生，主要从事机器视觉与深度学习研究 .

作者简介: 潘健东，硕士研究生，主要从事机器视觉与深度学习研究
中南大学交通运输工程学院，长沙 410075