基于强化学习的增程式新能源汽车能量管理策略研究

邹博文; 张炳飞; 凌青海; 连源; 刘俊; 杜慎之; 马华君

doi:10.13718/j.cnki.xdzk.2022.03.001

基于强化学习的增程式新能源汽车能量管理策略研究

1.
西南大学人工智能学院, 重庆 400715

2.
重庆小康动力有限公司, 重庆 401228

基金项目: 重庆市技术创新与应用发展专项资助项目(cstc2019jscx-zdztzxX0042)

详细信息

作者简介:
邹博文, 博士, 教授, 主要从事新能源汽车与智能汽车控制研究 .

中图分类号: U461.8

Optimizing Range-extended Vehicle Energy Management Strategy Based on Reinforcement Learning Method

1.
School of Artificial Intelligence, Southwest University, Chongqing 400715, China

2.
Chongqing Xiaokang Power Co., Ltd., Chongqing 401228, China

摘要: 具有油、电多能源系统的增程式插电混动是新能源汽车的重要技术途径之一. 为了寻找增程汽车更优的能量消耗率, 本研究以一款增程式汽车为研究对象, 探讨了该车基于规则的最优能量管理策略与基于强化学习的最优能量管理策略. 在MATLAB软件下搭建策略模型并与AVL/Cruise进行联合仿真, 仿真结果表明, 在全球统一轻型车辆测试循环(WLTC)标准下, 基于强化学习优化后的能量管理策略比原先基于规则的能量管理策略能量消耗率减少了3.2%.
- 新能源 /
- 增程式 /
- 强化学习 /
- 能量管理
Abstract: The extended-range plug-in hybrid with gasoline and electric multi-energy system is one of the important technical approaches for new energy vehicles. In order to find a better energy consumption rate for range-extended vehicles, a range-extended hybrid vehicle is taken as the research object. The rule-based optimal energy management strategy and optimal energy management strategy based on reinforcement learning were studied. The strategy model was built with MATLAB software and co-simulated with AVL/Cruise. The simulation results showed that the optimized energy management strategy based on reinforcement learning under the global unified light vehicle test cycle (WLTC) standard is more energy-efficient than the original rule-based energy management strategy by 3.2%.
- new energy /
- range-extended vehicle /
- reinforcement learning /
- energy management .

图 1 增程式插电混动汽车结构

下载: 全尺寸图片幻灯片

图 2 控制策略流程图

下载: 全尺寸图片幻灯片

图 3 强化学习结构图

下载: 全尺寸图片幻灯片

图 4 状态动作值函数更新流程图

下载: 全尺寸图片幻灯片

图 5 AVL/Cruise的整车模型图

下载: 全尺寸图片幻灯片

图 6 WLTC循环工况

下载: 全尺寸图片幻灯片

图 7 联合仿真实现

下载: 全尺寸图片幻灯片

图 8 强化学习策略结构图

下载: 全尺寸图片幻灯片

图 9 Q学习迭代过程

下载: 全尺寸图片幻灯片

图 10 WLTC工况下仿真迭代次数

下载: 全尺寸图片幻灯片

图 11 WLTC工况下两种策略SOC轨迹对比

下载: 全尺寸图片幻灯片

图 12 WLTC循环工况下两种策略综合能耗对比

下载: 全尺寸图片幻灯片

表 1 请求增程系统功率(部分)

整车需求功率/kW	车速0 km/h下输出功率/kW	车速25 km/h下输出功率/kW	车速55 km/h下输出功率/kW	车速75 km/h下输出功率/kW	车速95 km/h下输出功率/kW	车速115 km/h下输出功率/kW	车速135 km/h下输出功率/kW
0	10	15	15	20	25	30	35
5	10	15	15	20	25	30	35
10	10	15	15	20	25	30	35
15	10	15	15	20	30	35	40
20	10	15	15	20	30	35	40
25	10	15	15	25	30	35	45
30	10	15	20	25	35	40	45
35	10	15	20	25	35	40	45
50	10	15	20	25	35	40	50
70	10	15	20	25	35	40	50
100	10	15	20	25	35	40	50

下载: 导出CSV

表 2 AVL/Cruise仿真参数表

参数	值	参数	值
整备质量/kg	2005	滚动阻力系数/‰	8.5
迎风面积/m²	2.56	增程器功率/kW	80
风阻系数	0.32	驱动电机功率/kW	250
轮胎滚动半径/mm	366	电池组容量/kWh	35

下载: 导出CSV

表 3 WLTC工况下能量管理策略结果对比

能量管理策略	电池SOC值变化	油耗/L	折算后总油耗/L	能耗节省率/%
基于规则	0.197 4	0.719 7	1.522	0
基于强化学习	0.192 5	0.696 2	1.474 4	3.2

下载: 导出CSV

[1]	SHABBIR W, EVANGELOU S A. Exclusive Operation Strategy for the Supervisory Control of Series Hybrid e Lectric Vehicles[J]. IEEE Transactions on Control Systems Technology, 2016, 24(6): 1-9. doi: 10.1109/TCST.2016.2610238
[2]	ZHUANG W, ZHANG X, DING Y, et al. Comparison of Multi-mode Hybrid Powertrains with Multiple Planetary Gears[J]. Applied Energy, 2016, 178: 624-632. doi: 10.1016/j.apenergy.2016.06.111
[3]	胡平, 张浩. 基于用户接受度的增程式混合动力汽车控制策略研究[J]. 汽车工程学报, 2011, 1(5): 455-463. doi: 10.3969/j.issn.2095-1469.2011.05.004
[4]	席利贺, 张欣, 孙传扬, 等. 增程式电动汽车自适应能量管理策略[J]. 吉林大学学报(工学版), 2018, 38(6): 1636-1644. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JLGY201806002.htm
[5]	BANVAIT H, ANWAR S, CHEN Y. A Rule-based Energy Management Strategy for Plug-in Hybrid Electric Vehicle (PHEV)[C]. St. Louis: American Control Conference, 2009.
[6]	doi: http://www.onacademic.com/detail/journal_1000038532103310_67a3.html PENG J, HE H, XIONG R. Rule Based Energy Management Strategy for a Series-parallel Plug-in hybrid Electric Bus Optimized by Dynamic Programming[J]. Applied Energy, 2016, 185: 1633-1643.
[7]	WANG Y, SHEN Y, YUAN X, et al. Operating Point Optimization of Auxiliary Power Unit Based on Dynamic Combined Cost Map and Particle Swarm Optimization[J]. IEEE Transactions on Power Electronics, 2015, 30(12): 7038-7050. doi: 10.1109/TPEL.2014.2383443
[8]	ONORI S, TRIBIOlI L. Adaptive Pontryagin's Minimum Principle Supervisory Controller Design for the 12plug-in Hybrid GM Chevrolet Volt[J]. Applied Energy, 2015, 147: 224-234. doi: 10.1016/j.apenergy.2015.01.021
[9]	秦大同, 秦岭. 基于显式随机模型预测控制的功率分流式混合动力车辆能量管理策略[J]. 华南理工大学学报(自然科学版), 2019, 47(7): 112-120. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-HNLG201907015.htm
[10]	赵治国, 王茂垚, 郭元强, 等. 新型功率分流混合动力系统能量管理预测优化[J]. 西安交通大学学报, 2019, 53(1): 52-61. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-XAJT201901007.htm
[11]	林歆悠, 冯其高, 张少博. 等效因子离散全局优化的等效燃油瞬时消耗最小策略能量管理策略[J]. 机械工程学报, 2016, 52(20): 102-110. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JXXB201620014.htm
[12]	LIU J, CHEN W, LI W, et al. Hybrid-trip-model-based Energy Management of a PHEV with Computation-optimized Dynamic Programming[J]. IEEE Transactions on Vehicular Technology, 2018, 67: 338-353. doi: 10.1109/TVT.2017.2777852
[13]	刘辉, 李训明, 王伟达. 基于最优功率分配因子的插电式混合动力汽车实时能量管理策略研究[J]. 机械工程学报, 2019, 55(4): 91-101. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JXXB201904012.htm
[14]	胡晓松, 陈科坪, 唐小林, 等. 基于机器学习速度预测的并联混合动力车辆能量管理研究[J]. 机械工程学报, 2020, 56(16): 181-192. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JXXB202016019.htm
[15]	FRIES M, KRUTTSCHNITT M, LIENKAMP M. Operational Strategy of Hybrid Heavy-duty Trucks by Utilizing a Genetic Algorithm to Optimize the Fuel Economy Multiobjective Criteria[J]. IEEE Transactions on Industry Applications, 2018, 54(4): 3668-3675. doi: 10.1109/TIA.2018.2823693
[16]	doi: http://www.onacademic.com/detail/journal_1000034841298210_7fcb.html LIN C, PENG H, GRIZZLE J W, et al. Power Management Strategy for a Parallel Hybrid Electric Truck[J]. IEEE Transactions on Control Systems Technology, 2004, 11: 839-849.
[17]	杨超, 杜雪龙, 王伟达, 等. 智能网联环境下的PHEV实时优化能量管理策略研究[J]. 汽车安全与节能学报, 2021, 12(2): 210-218. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-QCAN202102009.htm
[18]	陈征, 刘亚辉, 杨芳. 基于进化-增强学习方法的插电式混合动力公交车能量管理策略[J]. 机械工程学报. 2017, 53(16): 86-93. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JXXB201716009.htm
[19]	QI X, LUO Y, WU G, et al. Deep Reinforcement Learning Enabled Self-learning Control for Energy Efficient Driving[J]. Transportation Research Part C: Emerging Technologies, 2019, 99: 67-81. doi: 10.1016/j.trc.2018.12.018
[20]	杨宁康, 韩立金, 刘辉, 等. 基于效率优化的混合动力车辆强化学习能量管理策略研究[J]. 汽车工程, 2021, 43(7): 1046-1056. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-QCGC202107013.htm
[21]	高阳, 陈世福, 陆鑫. 强化学习研究综述[J]. 自动化学报, 2004, 30(1): 86-100. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-MOTO200401010.htm

图( 12) 表( 3)

计量

文章访问数: 738
HTML全文浏览数: 738
PDF下载数: 43
施引文献: 0

全文HTML

开放科学(资源服务)标识码(OSID):
增程式汽车较好解决了续驶里程和污染物排放问题，是实现“碳达峰、碳中和”的重要抓手. 增程式汽车的结构相对复杂且具有多个工作模式，对动力系统进行精确控制以便提升车辆的节油率是当前的研究热点^[1].

目前，增程式电动汽车的能量管理策略(Energy Management Strategy，EMS)主要分为基于规则的EMS和基于优化的EMS^[2-4]. 常见的基于规则的EMS有恒温器控制、发动机多工作点控制、功率跟随控制. 如Banvait等人提出在车辆启动时电池给发动机提供助力使其工作点落在高效区，以改善车辆燃油经济性^[5]. 不足之处是该方法仅适用于特定的工况下，局限性较强. 基于优化的EMS主要有动态规划^[6-7]、庞特里亚金最小值原理^[8]、模型预测控制^[9-10]、等效能耗最小^[11]、人工智能技术等^[12-15]. 如Lin等人利用动态规划设计了最优EMS策略，并在NEDC工况下验证了该方法的有效性^[16]. 但该方法往往需要事先获得行驶工况信息，一般不能实现即时控制.

鉴于基于规则的EMS和基于优化的EMS都存在不足^[17-18]，因此有必要探索新的方法. 人工智能是模拟、延伸和扩展人的智能的一门技术科学，它擅长于解决决策、控制、优化系统中的复杂问题. 本研究将其中的强化学习方法应用于增程式汽车能量管理问题形成基于强化学习的EMS，并与基于规则的EMS在相同条件下进行对比仿真，以期研究该方法的节油效果.

4. 总结

根据研究对象的结构建立模型并进行仿真，结果表明基于强化学习的能量管理策略比基于规则的能量管理策略能量消耗率减少了3.2%. 因此，在WLTC循环工况下基于强化学习的能量管理策略是一种相对更优的能量管理策略. 考虑到车辆实际运行的工况比模型要复杂，故还需进行实车测试以便检验能量分配策略的可靠性. 但基于强化学习方法训练得出的EMS可为工程上最优增程器输出功率标定提供范围，该范围下将显著减少工程人员标定工作量.

参考文献 (21)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

留言板

基于强化学习的增程式新能源汽车能量管理策略研究

1.
西南大学人工智能学院, 重庆 400715

2.
重庆小康动力有限公司, 重庆 401228

作者简介:
邹博文, 博士, 教授, 主要从事新能源汽车与智能汽车控制研究 .

Optimizing Range-extended Vehicle Energy Management Strategy Based on Reinforcement Learning Method

1.
School of Artificial Intelligence, Southwest University, Chongqing 400715, China

2.
Chongqing Xiaokang Power Co., Ltd., Chongqing 401228, China

计量

基于强化学习的增程式新能源汽车能量管理策略研究

作者简介: 邹博文, 博士, 教授, 主要从事新能源汽车与智能汽车控制研究
1. 西南大学人工智能学院, 重庆 400715

2. 重庆小康动力有限公司, 重庆 401228

English Abstract

Optimizing Range-extended Vehicle Energy Management Strategy Based on Reinforcement Learning Method

全文HTML

1.1. 增程汽车模型

1.2. 基于规则的能量管理策略

2.1. 强化学习

2.2. 强化学习的模型对象及能量管理策略

2.2.1. 状态

2.2.2. 动作

2.2.3. 奖赏值

2.2.4. 动作更新选择

2.2.5. 状态动作值更新选择

3.1. 仿真车型参数与条件

3.2. 能量管理策略仿真

3.2.1. 基于规则的能量管理策略仿真

3.2.2. 基于强化学习的能量管理策略仿真

3.3. 仿真结果分析

目录

留言板

基于强化学习的增程式新能源汽车能量管理策略研究

1. 西南大学 人工智能学院, 重庆 400715 2. 重庆小康动力有限公司, 重庆 401228

作者简介: 邹博文, 博士, 教授, 主要从事新能源汽车与智能汽车控制研究 .

Optimizing Range-extended Vehicle Energy Management Strategy Based on Reinforcement Learning Method

1. School of Artificial Intelligence, Southwest University, Chongqing 400715, China 2. Chongqing Xiaokang Power Co., Ltd., Chongqing 401228, China

计量

出版历程

基于强化学习的增程式新能源汽车能量管理策略研究

作者简介: 邹博文, 博士, 教授, 主要从事新能源汽车与智能汽车控制研究 1. 西南大学 人工智能学院, 重庆 400715 2. 重庆小康动力有限公司, 重庆 401228

English Abstract

Optimizing Range-extended Vehicle Energy Management Strategy Based on Reinforcement Learning Method

全文HTML

1.1. 增程汽车模型

1.2. 基于规则的能量管理策略

2.1. 强化学习

2.2. 强化学习的模型对象及能量管理策略

2.2.1. 状态

2.2.2. 动作

2.2.3. 奖赏值

2.2.4. 动作更新选择

2.2.5. 状态动作值更新选择

3.1. 仿真车型参数与条件

3.2. 能量管理策略仿真

3.2.1. 基于规则的能量管理策略仿真

3.2.2. 基于强化学习的能量管理策略仿真

3.3. 仿真结果分析

目录

1.
西南大学人工智能学院, 重庆 400715

2.
重庆小康动力有限公司, 重庆 401228

作者简介:
邹博文, 博士, 教授, 主要从事新能源汽车与智能汽车控制研究 .

1.
School of Artificial Intelligence, Southwest University, Chongqing 400715, China

2.
Chongqing Xiaokang Power Co., Ltd., Chongqing 401228, China

作者简介: 邹博文, 博士, 教授, 主要从事新能源汽车与智能汽车控制研究
1. 西南大学人工智能学院, 重庆 400715

2. 重庆小康动力有限公司, 重庆 401228