深度|SLAM的前世今生 | 解惑一直来的疑问 凌鸟智能

【深度|SLAM的前世今生 | 解惑一直来的疑问 凌鸟智能】随着AGV市场的不断增大 , 需求增大 , 应用场景也越来越复杂 , AGV的创新也是随之而来 , 在导航上 , 从最开始的磁导航到二维码导航 , 激光导航 , 视觉导航 , 路径越来越柔性 , 布局越来越美观 , 维护越来越方便 。

深度|SLAM的前世今生 | 解惑一直来的疑问 凌鸟智能
文章图片

当下最流行的就是SLAM技术 , 从最早的军事用途(核潜艇海底定位就有了SLAM的雏形)到今天 , 已经逐步走入人们的视野 , 过去几年扫地机器人的盛行让它名声大噪 , 近期基于三维视觉的VSLAM又让它越来越显主流 , 但是大家对SLAM的理解也是层出不穷 。

深度|SLAM的前世今生 | 解惑一直来的疑问 凌鸟智能
文章图片

1964年美国投入使用GPS , 突然就打破了大家的游戏规则 。 军用的P码可以达到1-2米级精度 , 开放给大众使用的CA码也能够实现5-10米级的精度 。
后来大家一方面为了突破P码封锁 , 另一方面为了追求更高的定位定姿精度 , 想出了很多十分具有创意的想法来挺升GPS的精度 。 利用RTK的实时相位差分技术 , 甚至能实现厘米的定位精度 , 基本上解决了室外的定位和定姿问题 。
但是室内这个问题就难办多了 , 为了实现室内的定位定姿 , 一大批技术不断涌现 , 其中 , SLAM技术逐渐脱颖而出 。 首先要从它的传感器讲起~
目前用在SLAM上的Sensor主要分两大类 , 激光雷达和摄像头 。

深度|SLAM的前世今生 | 解惑一直来的疑问 凌鸟智能
文章图片

这里面列举了一些常见的雷达和各种深度摄像头 。 激光雷达有单线多线之分 , 角分辨率及精度也各有千秋 。 SICK、velodyne、Hokuyo以及国内的北醒光学、Slamtech是比较有名的激光雷达厂商 。 他们可以作为SLAM的一种输入形式 。
这个小视频里展示的就是一种简单的2D SLAM 。

深度|SLAM的前世今生 | 解惑一直来的疑问 凌鸟智能
文章图片

而VSLAM则主要用摄像头来实现 , 摄像头品种繁多 , 主要分为单目、双目、单目结构光、双目结构光、ToF几大类 。 他们的核心都是获取RGB和depth map(深度信息) 。
▌最近流行的结构光和TOF
结构光原理的深度摄像机通常具有激光投射器、光学衍射元件(DOE)、红外摄像头三大核心器件 。

深度|SLAM的前世今生 | 解惑一直来的疑问 凌鸟智能
文章图片

这个图(下图)摘自primesense的专利 。
可以看到primesense的doe是由两部分组成的 , 一个是扩散片 , 一个是衍射片 。 先通过扩散成一个区域的随机散斑 , 然后复制成九份 , 投射到了被摄物体上 。 根据红外摄像头捕捉到的红外散斑 , PS1080这个芯片就可以快速解算出各个点的深度信息 。
这儿还有两款结构光原理的摄像头 。

深度|SLAM的前世今生 | 解惑一直来的疑问 凌鸟智能
文章图片


深度|SLAM的前世今生 | 解惑一直来的疑问 凌鸟智能
文章图片

第一页它是由两幅十分规律的散斑组成 , 最后同时被红外相机获得 , 精度相对较高 。 但据说DOE成本也比较高 。
还有一种比较独特的方案(最后一幅图) , 它采用mems微镜的方式 , 类似DLP投影仪 , 将激光器进行调频 , 通过微镜反射出去 , 并快速改变微镜姿态 , 进行行列扫描 , 实现结构光的投射 。 (产自ST , ST经常做出一些比较炫的黑科技) 。
ToF(time of flight)也是一种很有前景的深度获取方法 。
传感器发出经调制的近红外光 , 遇物体后反射 , 传感器通过计算光线发射和反射时间差或相位差 , 来换算被拍摄景物的距离 , 以产生深度信息 。 类似于雷达 , 或者想象一下蝙蝠 , softkinetic的DS325采用的就是ToF方案(TI设计的) , 但是它的接收器微观结构比较特殊 , 有2个或者更多快门 , 测ps级别的时间差 , 但它的单位像素尺寸通常在100um的尺寸 , 所以目前分辨率不高 。
有了深度图之后呢 , SLAM算法就开始工作了 , 由于Sensor和需求的不同 , SLAM的呈现形式略有差异 。 大致可以分为激光SLAM(也分2D和3D)和视觉SLAM(也分Sparse、semiDense、Dense)两类 , 但其主要思路大同小异 。

深度|SLAM的前世今生 | 解惑一直来的疑问 凌鸟智能
文章图片

▌SLAM算法实现的4要素
SLAM算法在实现的时候主要要考虑以下4个方面吧:

1. 地图表示问题 , 比如dense和sparse都是它的不同表达方式 , 这个需要根据实际场景需求去抉择
2. 信息感知问题 , 需要考虑如何全面的感知这个环境 , RGBD摄像头FOV通常比较小 , 但激光雷达比较大
3. 数据关联问题 , 不同的sensor的数据类型、时间戳、坐标系表达方式各有不同 , 需要统一处理
4. 定位与构图问题 , 就是指怎么实现位姿估计和建模 , 这里面涉及到很多数学问题 , 物理模型建立 , 状态估计和优化
其他的还有回环检测问题 , 探索问题(exploration) , 以及绑架问题(kidnapping) 。

深度|SLAM的前世今生 | 解惑一直来的疑问 凌鸟智能
文章图片

这个是一个比较有名的SLAM算法 , 这个回环检测就很漂亮 。 但这个调用了cuda , gpu对运算能力要求挺高 , 效果看起来比较炫 。
▌SLAM的今生——最大的困难
多传感器融合、优化数据关联与回环检测、与前端异构处理器集成、提升鲁棒性和重定位精度都是SLAM技术接下来的发展方向 , 但这些都会随着消费刺激和产业链的发展逐步解决 。 就像手机中的陀螺仪一样 , 在不久的将来 , 也会飞入寻常百姓家 , 改变人类的生活 。
SLAM在全面进入消费级市场的过程中 , 也面对着一些阻力和难题 。 比如Sensor精度不高、计算量大、Sensor应用场景不具有普适性等等问题 。
激光雷达优点是可视范围广 , 但是缺点性价比低 , 低成本的雷达角分辨率不够高 , 影响到建模精度 。 vSLAM的话缺点就是FOV通常不大 , 50-60degree , 这样高速旋转时就容易丢 。 不过 , 市场还是有解决方案的 。

深度|SLAM的前世今生 | 解惑一直来的疑问 凌鸟智能
文章图片

    推荐阅读