深度学习LiDAR定位：L3-Net

摘要

本文提出L3-Net——一种新颖的基于学习的LiDAR定位系统，可实现厘米级的定位，与现有最高水平的传统定位算法相媲美。与传统定位算法不同，本文创新地实现了使用各种深度神经网络结构来建立基于学习的定位算法。首先，L3-Net会学习专门针对不同现实驾驶场景中的匹配而优化的局部描述，在解决方案空间中建立的成本量上的3D卷积显著提高了定位精度。其次，使用RNN对车辆动力学进行建模，从而获得更好的时间平滑度和准确性。然后，本文使用新收集的数据集全面验证了L3-Net的有效性。最后，本文使用了具有挑战的SunnyvaleBigLoop序列(在采集的地图和测试数据之间间隔了一年时间的序列)进行测试，测试结果表明，L3-Net在这些数据集中具有很低的定位误差，证明了其在实际工业实现中的成熟度。

背景及问题描述

传统LiDAR定位算法流程与基于学习的定位算法流程对比如图1所示。其中，传统算法的步骤通常是：特征描述（如点、平面、杆、2D栅格上基于高度的高斯特征等）、地图匹配、匹配误差的计算、空间搜索或优化（如全搜索或由粗到精的搜索，蒙特卡洛采样或迭代梯度下降最小化）。这些传统算法中，通常需要利用点云的几何特征、反射强度特征来进行配准或滤波，实现定位。常见的有基于ICP、NDT、直方图滤波、卡尔曼滤波等的定位算法。尽管其中一些算法具有不同场景下出色的准确性和鲁棒性，但通常需要大量的工程工作来调优流程中的每个模块，并设计硬编码的特征和匹配方法。此外，这些传统定位算法的系统类型对运行场景有很强的偏好。要使一个通用的定位系统能够适应所有具有挑战性的场景需要巨大的工程努力，这通常是极其困难的。

图 1 传统与基于学习的定位算法流程图

而基于学习的方法以数据驱动的方式为上述问题的解决开辟了一条全新的道路。

主要贡献

（1）根据作者了解，这是当时第一个基于学习的，用于自动驾驶的LiDAR定位框架，可直接处理点云并准确估计车辆的位置和方向，并能得到与当时最好的算法相媲美的效果。

（2）创新性的使用3D卷积学习如何调整x，y，yaw这三个维度上的匹配代价以提高定位精度

（3）将提出的算法在同一条道路上在不同时间进行了多次试验，并在各种城市道路上进行严格的测试；发布数据集，数据集包含超过380公里的真实交通驾驶场景的数据，适合定位任务。

主要原理及思路

L3-Net主要由Keypoint Selection、Descriptor Extraction、Cost Volume and 3D CNNs、Probability Offset Volume、以及Temporal Smoothness五个部分组成。输入为已构建的点云地图和行驶时的LiDAR观测数据。接下来分五个部分分别描述L3-Net的细节。L3-Net网络架构如图2所示：