半直接法与IMU融合的双目视觉里程计

种一帆; 冀杰; 宫铭钱; 陈琼红

doi:10.13718/j.cnki.xsxb.2021.02.019

半直接法与IMU融合的双目视觉里程计

西南大学工程技术学院，重庆 400715

基金项目: 国家自然科学基金(61304189); 中央高校基本业务费专项资金重点项目(XDJK2019B053); 汽车主动安全测试技术重庆市工业和信息化重点实验室2019年度开放课题(19AKC8)

详细信息

作者简介:
种一帆，硕士研究生，主要从事计算机视觉和视觉里程计的研究 .

通讯作者: 冀杰，副教授，硕士生导师;

中图分类号: TP242

A Stereo Visual Odometry Aided by IMU based on Semi-direct Method

College of Engineering and Technology, Southwest University, Chongqing 400715, China

摘要: 针对基于特征点法的视觉里程计实时性和鲁棒性较差的问题，提出一种基于半直接法的双目视觉惯性里程计算法. 在跟踪线程中将惯性测量数据作为先验，并使用逆光流法跟踪均匀化的特征关键点，以提高特征匹配的速度和鲁棒性，构建高精度的初始化地图，为后续的运动估计提供良好的初值. 使用简化的双目视觉模型构造重投影误差，结合IMU误差项构建联合优化模型，并在滑动窗口中进行非线性优化求解. 实验结果显示，该算法在数据集上的定位精度达到主流算法的水平，与VINS-Fusion算法相比，此算法拥有更低的CPU负载和更高的运行帧率.
- 实时性 /
- 鲁棒性 /
- 简化的双目视觉模型 /
- 初始化地图 /
- 非线性优化
Abstract: A stereo visual inertial odometry based on semi-direct method has been proposed to improve the poor real-time performance and robustness of visual odometry based on feature-based method. The inertial measurement data is used as a priori in the tracking thread, and the reverse optical flow method is used to track the homogenized feature key points to improve the speed and robustness of feature matching. A high-precision initialization map is constructed to provide a accurate initial value for the subsequent motion estimation. The joint optimization model, which is constructed by combining the reprojection error which is constructed by a simplified stereovision model and IMU error, is solved by nonlinear-optimization in the sliding window. The experimental results show that positioning accuracy of the proposed algorithm reaches the level of the mainstream algorithm. Compared with the VINS-Fusion, our algorithm in this paper has lower CPU load and higher running frequency.
- real-time performance /
- robustness /
- simplified stereo visual model /
- initialization map /
- nonlinear-optimization .

图 1 本文算法流程图

下载: 全尺寸图片幻灯片

图 2 特征提取结果

下载: 全尺寸图片幻灯片

图 3 逆光流跟踪算法原理

下载: 全尺寸图片幻灯片

图 4 MH_01数据集中里程计定位效果

下载: 全尺寸图片幻灯片

图 5 MH_04数据集中里程计定位效果

下载: 全尺寸图片幻灯片

图 6 V2_01数据集中里程计定位效果

下载: 全尺寸图片幻灯片

图 7 V2_03数据集中算法的定位误差

下载: 全尺寸图片幻灯片

图 8 MH_03数据集中里程计定位效果

下载: 全尺寸图片幻灯片

图 9 V1_02数据集中里程计定位效果

下载: 全尺寸图片幻灯片

表 1 角点检测耗时(ms)

检测算法	角点数量	总耗时	平均耗时
传统FAST	1 989	73.18	0.037
FAST角点均匀化处理	237	68.52	0.289

下载: 导出CSV

表 2 各算法的RMSE对比

数据集	MH_01	MH_03	MH_05	V1_01	V1_02	V1_03	V2_01	V2_02	V2_03
ORB-SLAM2	0.036	0.071	0.064	0.031	0.065	0.092	0.071	0.161	0.265
VINS-Fusion	0.251	0.289	0.318	0.152	0.113	0.120	0.120	0.086	0.216
Ours	0.174	0.167	0.262	0.158	0.084	0.077	0.097	0.093	0.159

下载: 导出CSV

表 3 CPU负载和运行帧率的统计

数据集	CPU负载/%		运行帧率/Hz
数据集	VINS-Fusion	本文算法	VINS-Fusion	本文算法
MH_01_easy	54.14	47.25	28.62	37.02
MH_02_easy	47.78	41.72	28.13	36.83
MH_03_medium	45.84	42.52	27.14	35.31
MH_04_difficult	50.45	49.87	27.98	36.47
MH_05_difficult	53.27	50.84	26.85	35.96
V1_01_easy	55.76	48.76	26.71	34.72
V1_02_medium	49.86	45.25	27.26	34.36
V1_03_difficult	51.69	49.69	28.46	36.75
V2_01_easy	52.33	49.78	27.93	35.61
V2_02_medium	51.09	46.26	26.76	34.63
V2_03_difficult	49.84	44.65	26.84	41.38
Average	51.01	49.96	27.52	36.28

下载: 导出CSV

[1]	孙永全, 田红丽. 视觉惯性SLAM综述[J]. 计算机应用研究, 2019, 36(12): 3530-3533, 3552. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JSYJ201912002.htm
[2]	DAVISON A J, REID I D, MOLTON N D, et al. MonoSLAM: Real-Time Single Camera SLAM[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2007, 29(6): 1052-1067. doi: 10.1109/TPAMI.2007.1049
[3]	KLEIN G, MURRAY D. Parallel Tracking and Mapping for Small AR Workspaces[C]//2007 6th IEEE and ACM International Symposium on Mixed and Augmented Reality. November 13-16, 2007, Nara, Japan. IEEE, 2007: 225-234.
[4]	MUR-ARTAL R, MONTIEL J M M, TARDOS J D. ORB-SLAM: A Versatile and Accurate Monocular SLAM System[J]. IEEE Transactions on Robotics, 2015, 31(5): 1147-1163. doi: 10.1109/TRO.2015.2463671
[5]	ENGLE J, SCHöPS T, CREMERS D. LSD-SLAM: Large-Scale Direct Monocular SLAM[C]//European Conference on Computer Vision. Springer, Cham, 2014: 834-849.
[6]	ENGEL J, KOLTUN V, CREMERS D. Direct Sparse Odometry[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2018, 40(3): 611-625. doi: 10.1109/TPAMI.2017.2658577
[7]	FORSTER C, PIZZOLI M, SCARAMUZZA D. SVO: Fast Semi-direct Monocular Visual Odometry[C]//2014 IEEE International Conference on Robotics and Automation (ICRA). May 31-June 7, 2014, Hongkong, China. IEEE, 2014: 15-22.
[8]	QIN T, LI P L, SHEN S J. Vins-Mono: A Robust and Versatile Monocular Visual-inertial State Estimator[J]. IEEE Transactions on Robotics, 2018, 34(4): 1004-1020. doi: 10.1109/TRO.2018.2853729
[9]	SUN K, MOHTA K, PFROMMER B, et al. Robust Stereo Visual Inertial Odometry for Fast Autonomous Flight[J]. IEEE Robotics and Automation Letters, 2018, 3(2): 965-972. doi: 10.1109/LRA.2018.2793349
[10]	BLOESCH M, BURRI M, OMARI S, et al. Iterated Extended Kalman Filter based Visual-Inertial Odometry using Direct Photometric Feedback[J]. The International Journal of Robotics Research, 2017, 36(10): 1053-1072. doi: 10.1177/0278364917728574
[11]	MOURIKIS A I, ROUMELIOTIS S I. A Multi-State Constraint Kalman Filter for Vision-aided Inertial Navigation[C]//Proceedings 2007 IEEE International Conference on Robotics and Automation. April 10-14, 2007, Roma, Italy. IEEE, 2007: 3565-3572.
[12]	LEUTENEGGER S, FURGALE P, RABAUD V, et al. Keyframe-based Visual-inertial SLAM Using Nonlinear Optimization[J]. Proceedings of Robotis Science and Systems (RSS) 2013, 2013.
[13]	WANG G, SUN X, SHANG Y, et al. Two-View Geometry Estimation Using RANSAC With Locality Preserving Constraint[J]. IEEE Access, 2020, 8: 7267-7279. doi: 10.1109/ACCESS.2020.2964425
[14]	VOGIATZIS G, HERNáNDEZ C. Video-Based, Real-Time Multi-View Stereo[J]. Image and Vision Computing, 2011, 29(7): 434-441. doi: 10.1016/j.imavis.2011.01.006
[15]	李勇, 刘鹤飞, 王坤, 等. 隐马尔科夫多元线性回归模型中未知隐状态个数的贝叶斯模型选择[J]. 西南师范大学学报(自然科学版), 2020, 45(7): 11-17. doi: http://xbgjxt.swu.edu.cn/article/doi/10.13718/j.cnki.xsxb.2020.07.002
[16]	许翊, 刘学军. 计算机双目视觉中的动态规划立体匹配算法研究[J]. 西南师范大学学报(自然科学版), 2020, 45(9): 118-123. doi: http://xbgjxt.swu.edu.cn/article/doi/10.13718/j.cnki.xsxb.2020.09.018

图( 9) 表( 3)

计量

文章访问数: 2052
HTML全文浏览数: 2052
PDF下载数: 97
施引文献: 0

全文HTML

随着计算机和传感器技术的不断发展，视觉SLAM(即时定位与地图构建)逐渐成为智能驾驶、自主机器人和无人机等新兴领域的核心技术. 视觉里程计根据相机采集到的图像信息计算运动载体的位姿，并选取关键帧用于建图和后端优化，是视觉SLAM的核心部分. 图像特征是视觉里程计最重要的定位信息之一，对其提取和跟踪的结果将直接影响整个系统的稳定性. 根据图像信息处理方法的不同，视觉里程计主要分为特征点法和直接法两类^[1]. 很多经典的算法通过计算描述子来实现对特征关键点的跟踪和匹配^[2-4]，但这种组合方式仍存在一些的问题：特征描述子的计算会给CPU带来很大压力，算法在特征纹理不明显的场景下无法工作等. LSD-SLAM以及DSO等一系列的直接法算法的提出给研究者提供了解决这些问题的另一种思路^[5-6]：基于图像的灰度变化对图像帧中的特征像素进行匹配，这种方式节省了特征提取以及描述子计算的时间，只要图像中存在像素的明暗变化，直接法就可以通过最小化光度误差完成相机运动的估计，然而，直接法对光照变化极其敏感，而且无法应对较大幅度的快速运动. 近年来，研究者的目光逐渐集中到基于半直接法的视觉里程计^[7-10]，这类算法通过特征对齐和稀疏图像对齐避免了显式的特征匹配过程，节约了描述子计算和匹配的时间，拥有极高的计算效率，同时也避免了像直接法一样需要较高的采样帧率，为在定位精度和计算效率之间找到合理的平衡提供了有效的途径.

图像信息可以提供丰富的运动约束，但当相机镜头被遮挡或是遇到纹理不明显的场景时，纯视觉里程计难以实现精准定位，而惯性测量单元可以在短期内提供可靠的运动估计，但由于IMU的测量特性，随着里程的增加累积误差也会变大. 作为目前主流的实时定位技术，视觉惯性里程计能够融合相机的图像信息和IMU的运动信息，兼具两种里程计的优势，从而获得较高的定位精度和鲁棒性. 然而，不同传感器的数据融合会增加算法的复杂性，因此需要进一步提升算法的鲁棒性和计算效率.

视觉惯性里程计根据融合框架的不同可以分为松耦合和紧耦合两类. 松耦合的框架中两种传感器信息分别单独处理，其中IMU模块仅用于辅助视觉模块的位姿估计，这类框架的信息融合通常由扩展卡尔曼滤波完成. 紧耦合的框架则是将IMU和视觉约束信息放在同一个非线性优化函数中进行状态估计. 目前的研究结果表明，基于松耦合的算法在计算效率上有一定优势，但在紧耦合框架中，IMU数据可以对视觉模块进行补充，同时视觉信息也可以矫正IMU的零偏，因此一般认为紧耦合算法的定位精度更高. 另外，根据求解思路的不同又可以将视觉惯性里程计分为基于滤波和基于优化的两种方法. MSCKF是一个经典的基于滤波的紧耦合方案，它在一个滑动的窗口中按时序排列邻近帧的相机状态量，共同建立约束处理位姿优化^[11]. 近年来，随着研究的深入和计算机性能的提高，基于优化的算法逐渐占据VIO研究的主体地位. 这类算法通过求解一个非线性优化问题，实现对历史位姿更为平滑的估计.

3. 结论

本文提出了一种基于半直接法的双目视觉惯性里程计算法，在系统初始化阶段，结合惯性测量数据和双目相机的图像信息构建高精度的初始化地图，为后端的位姿优化提供良好的初值; 使用简化的双目视觉模型构建重投影误差，减少了对右相机图像中多余的测量值的计算; 在滑动窗口边优化的过程中选择性地剔除部分图像帧信息，确保在优化过程中拥有足够参考信息的同时尽可能地减少优化计算量; 与ORB-SLAM2和VINS-Fusion算法的实验对比表明，本文算法在定位精度上已达到主流的视觉里程计的水平，并且在计算效率方面有一定程度的提高.

参考文献 (16)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

留言板

半直接法与IMU融合的双目视觉里程计

西南大学工程技术学院，重庆 400715

作者简介:
种一帆，硕士研究生，主要从事计算机视觉和视觉里程计的研究 .

通讯作者: 冀杰，副教授，硕士生导师;

A Stereo Visual Odometry Aided by IMU based on Semi-direct Method

College of Engineering and Technology, Southwest University, Chongqing 400715, China

计量

半直接法与IMU融合的双目视觉里程计

通讯作者: 冀杰，副教授，硕士生导师;

作者简介: 种一帆，硕士研究生，主要从事计算机视觉和视觉里程计的研究
西南大学工程技术学院，重庆 400715

English Abstract

A Stereo Visual Odometry Aided by IMU based on Semi-direct Method

Corresponding author: JI Jie ;

全文HTML

1.1. 符号说明

1.2. 算法框架

1.3. IMU预积分

1.4. 特征提取与跟踪

1.5. 系统初始化

1.6. 视觉惯性联合优化

1.7. 边缘化

目录

留言板

半直接法与IMU融合的双目视觉里程计

西南大学 工程技术学院，重庆 400715

作者简介: 种一帆，硕士研究生，主要从事计算机视觉和视觉里程计的研究 .

通讯作者: 冀杰，副教授，硕士生导师;

A Stereo Visual Odometry Aided by IMU based on Semi-direct Method

College of Engineering and Technology, Southwest University, Chongqing 400715, China

计量

出版历程

半直接法与IMU融合的双目视觉里程计

通讯作者: 冀杰，副教授，硕士生导师;

作者简介: 种一帆，硕士研究生，主要从事计算机视觉和视觉里程计的研究 西南大学 工程技术学院，重庆 400715

English Abstract

A Stereo Visual Odometry Aided by IMU based on Semi-direct Method

Corresponding author: JI Jie ;

全文HTML

1.1. 符号说明

1.2. 算法框架

1.3. IMU预积分

1.4. 特征提取与跟踪

1.5. 系统初始化

1.6. 视觉惯性联合优化

1.7. 边缘化

目录

西南大学工程技术学院，重庆 400715

作者简介:
种一帆，硕士研究生，主要从事计算机视觉和视觉里程计的研究 .

作者简介: 种一帆，硕士研究生，主要从事计算机视觉和视觉里程计的研究
西南大学工程技术学院，重庆 400715