深度|SLAM的前世今生 | 解惑一直来的疑问凌鸟智能_精度|Sensor|摄像头|问题|定位

【深度|SLAM的前世今生 | 解惑一直来的疑问凌鸟智能】随着AGV市场的不断增大，需求增大，应用场景也越来越复杂， AGV的创新也是随之而来，在导航上，从最开始的磁导航到二维码导航，激光导航，视觉导航，路径越来越柔性，布局越来越美观，维护越来越方便。

文章图片

当下最流行的就是SLAM技术，从最早的军事用途（核潜艇海底定位就有了SLAM的雏形）到今天，已经逐步走入人们的视野，过去几年扫地机器人的盛行让它名声大噪，近期基于三维视觉的VSLAM又让它越来越显主流，但是大家对SLAM的理解也是层出不穷。

文章图片

1964年美国投入使用GPS ，突然就打破了大家的游戏规则。军用的P码可以达到1-2米级精度，开放给大众使用的CA码也能够实现5-10米级的精度。
后来大家一方面为了突破P码封锁，另一方面为了追求更高的定位定姿精度，想出了很多十分具有创意的想法来挺升GPS的精度。利用RTK的实时相位差分技术，甚至能实现厘米的定位精度，基本上解决了室外的定位和定姿问题。
但是室内这个问题就难办多了，为了实现室内的定位定姿，一大批技术不断涌现，其中， SLAM技术逐渐脱颖而出。首先要从它的传感器讲起~
目前用在SLAM上的Sensor主要分两大类，激光雷达和摄像头。

文章图片

这里面列举了一些常见的雷达和各种深度摄像头。激光雷达有单线多线之分，角分辨率及精度也各有千秋。 SICK、velodyne、Hokuyo以及国内的北醒光学、Slamtech是比较有名的激光雷达厂商。他们可以作为SLAM的一种输入形式。
这个小视频里展示的就是一种简单的2D SLAM 。

文章图片

而VSLAM则主要用摄像头来实现，摄像头品种繁多，主要分为单目、双目、单目结构光、双目结构光、ToF几大类。他们的核心都是获取RGB和depth map(深度信息) 。
▌最近流行的结构光和TOF
结构光原理的深度摄像机通常具有激光投射器、光学衍射元件（DOE）、红外摄像头三大核心器件。

文章图片

这个图（下图）摘自primesense的专利。
可以看到primesense的doe是由两部分组成的，一个是扩散片，一个是衍射片。先通过扩散成一个区域的随机散斑，然后复制成九份，投射到了被摄物体上。根据红外摄像头捕捉到的红外散斑， PS1080这个芯片就可以快速解算出各个点的深度信息。
这儿还有两款结构光原理的摄像头。

文章图片

文章图片

第一页它是由两幅十分规律的散斑组成，最后同时被红外相机获得，精度相对较高。但据说DOE成本也比较高。
还有一种比较独特的方案（最后一幅图），它采用mems微镜的方式，类似DLP投影仪，将激光器进行调频，通过微镜反射出去，并快速改变微镜姿态，进行行列扫描，实现结构光的投射。（产自ST ， ST经常做出一些比较炫的黑科技）。
ToF（time of flight）也是一种很有前景的深度获取方法。
传感器发出经调制的近红外光，遇物体后反射，传感器通过计算光线发射和反射时间差或相位差，来换算被拍摄景物的距离，以产生深度信息。类似于雷达，或者想象一下蝙蝠， softkinetic的DS325采用的就是ToF方案（TI设计的），但是它的接收器微观结构比较特殊，有2个或者更多快门，测ps级别的时间差，但它的单位像素尺寸通常在100um的尺寸，所以目前分辨率不高。
有了深度图之后呢， SLAM算法就开始工作了，由于Sensor和需求的不同， SLAM的呈现形式略有差异。大致可以分为激光SLAM（也分2D和3D）和视觉SLAM（也分Sparse、semiDense、Dense）两类，但其主要思路大同小异。

文章图片

▌SLAM算法实现的4要素
SLAM算法在实现的时候主要要考虑以下4个方面吧：

1. 地图表示问题，比如dense和sparse都是它的不同表达方式，这个需要根据实际场景需求去抉择

2. 信息感知问题，需要考虑如何全面的感知这个环境， RGBD摄像头FOV通常比较小，但激光雷达比较大

3. 数据关联问题，不同的sensor的数据类型、时间戳、坐标系表达方式各有不同，需要统一处理

4. 定位与构图问题，就是指怎么实现位姿估计和建模，这里面涉及到很多数学问题，物理模型建立，状态估计和优化

其他的还有回环检测问题，探索问题（exploration），以及绑架问题（kidnapping）。

文章图片

这个是一个比较有名的SLAM算法，这个回环检测就很漂亮。但这个调用了cuda ， gpu对运算能力要求挺高，效果看起来比较炫。
▌SLAM的今生——最大的困难
多传感器融合、优化数据关联与回环检测、与前端异构处理器集成、提升鲁棒性和重定位精度都是SLAM技术接下来的发展方向，但这些都会随着消费刺激和产业链的发展逐步解决。就像手机中的陀螺仪一样，在不久的将来，也会飞入寻常百姓家，改变人类的生活。
SLAM在全面进入消费级市场的过程中，也面对着一些阻力和难题。比如Sensor精度不高、计算量大、Sensor应用场景不具有普适性等等问题。
激光雷达优点是可视范围广，但是缺点性价比低，低成本的雷达角分辨率不够高，影响到建模精度。 vSLAM的话缺点就是FOV通常不大， 50-60degree ，这样高速旋转时就容易丢。不过，市场还是有解决方案的。