|马斯克:那些无聊且危险的事,交给机器人去做


作者 | 秦章勇
编辑 | 李欢欢
超级计算机Dojo、D1芯片、Tesla Bot……特斯拉再一次向外界证明 , 自己不只是一家电动汽车公司 。
8月20日 , 备受瞩目的特斯拉AI日如约而至 。 特斯拉CEO埃隆·马斯克(Elon Musk)在发布会开场强调 , 特斯拉拥有深度的AI技术学习能力 , 这更像是一家AI公司 。 本次发布的Dojo是一台超级计算机 , 负责训练AI算法 , 内置特斯拉自研AI芯片D1 , 该芯片拥有500亿个晶体管 , 峰值算力可达362TFLOPS 。 在这些强大的数据支持下 , Dojo通过深度学习之后可以拥有和人类等同的驾驶能力 。
令人意外的是 , 特斯拉首次展示了人工智能人型机器人Tesla Bot 。 该机器人身高5英尺8英寸(约合1.72米) , 体重125英镑(约合56.7千克) , 搭载特斯拉FSD电脑和Autopilot摄像头 。 马斯克表示 , 将在2022年推出Tesla Bot原型机 。
当然 , 举办AI日的目的主要是为了展示特斯拉在自动驾驶领域的最新技术成果 , 从神经网络学习能力到超级计算机 , 一旦量产实现规模化应用 , 特斯拉的自动驾驶实力将大大增强 。
有意思的是 , 在AI日举办前夕 , 美国国家公路交通安全管理局(NHTSA)对特斯拉驾驶辅助系统(Autopilot)展开了调查 , NHTSA认为Autopilot“难以识别停放在路边的车辆” 。 美国两位参议员也督促FTC调查特斯拉 , 认为特斯拉技术不成熟、夸大宣传FSD 。
AI日发布的这些新技术成果 , 能成为特斯拉应对调查的有力反击吗?
1
仅凭FSD可入账超千亿美元
数日之前 , 蔚来一位车主疑似因为蔚来NOP(领航辅助驾驶)发生交通事故不幸离世 , 一时之间 , 蔚来连同自动驾驶一并被推上风口浪尖 。 或是感受到舆论压力 , “安全”成为马斯克发布产品时使用的高频词汇 , “不能撞到任何东西 , 是(特斯拉)自动驾驶最基本的原则” 。
然而要做到这一点并不容易 , 此前特斯拉、蔚来等发生自动驾驶交通事故 , 有不少案例都是因为车辆没能成功识别障碍物而导致碰撞 。
最关键的就是要解决感知问题 , 目前 , 业内大致分为两个流派 , 一派是以特斯拉和Mobileye为首的纯视觉方案 , 另外一派是采用激光雷达以及摄像头等更多传感器的融合方案 。 无论何种方案都需要对海量的数据进行深度学习 , 也就是对神经网络的训练 。
发布会现场 , 坚信第一性原理的马斯克 , 再次展示了特斯拉视觉神经网络解决方案 , 从感知到决策都有不小的革新 。
特斯拉AI负责人Andrej Karpathy表示 , 可以将特斯拉采用的人工智能视作一种生物 , 特斯拉正训练其建模让车辆可以感知生物视觉 。 在感知层面 , Karpathy展示了特斯拉如何通过摄像头图像建模 , 以及模拟人脑处理图像的能力 。
特斯拉的神经网络系统采用多头路径 , 其中包括摄像机校准、缓存、队列和优化以简化所有任务 。 依靠视觉技术 , 特斯拉车辆甚至可以在行驶时有效地实时绘制地图 , 与Waymo等自动驾驶技术公司采用预先制定路线相比 , 是一个不小的突破 。
“我们有15个不同国家的道路数据 , 希望能够打破不同国家之间的壁垒 。 ”马斯克在现场表示 , 在车辆对数据进行学习、训练之后 , 可以适应不同国家的驾驶习惯 。 “所有驾驶员都可以看作经过培训的神经网络 。 ”
在车辆摄像头采集数据过程中 , 有大量数据是重复无用的 , Karpathy指出 , 特斯拉的神经网络系统拥有自己的数据标记团队 , 对各类数据比如道路数据、环境数据、行人数据等贴标 , 而且目前已经发展出自动标记技术 , 对有指导意义的训练数据样本进行筛选、标注 , 从而完成高效算法的提升 。
特斯拉自动驾驶软件负责人Ashok Elluswamy表示 , 这项技术可以帮助特斯拉“重组”道路上的场景 , 不仅能让车辆更快地标记数据 , 还能够在存在遮挡的情况下安全准确地导航 。 “这可以帮助特斯拉在FSD和Autopilot套件上摆脱雷达的限制 , 精准处理物体识别和道路规划等驾驶所需的数据 。 ”
根据刚推送的特斯拉FSD 9.2 Beta版 , 特斯拉的产品已经可以基于视觉方案 , 识别交通环境是否存在安全间隙 , 汽车可以沿着计划路径行驶到速度限制更高的路段 。
基于上述强大的技术 , EQM Indexes创始人兼CEO Jane Edmondson预测 , 未来十年 , 单凭FSD一项功能就能帮助特斯拉营收1590亿美元 。
2
更贴近L5级无人驾驶
将整套视觉网络在特斯拉车辆中运行 , 需要超级计算机 , 特斯拉这套系统背后的大脑——Dojo应运而生 , 这也是特斯拉AI日发布会的重磅产品 。
Dojo是一个通过网络结构连接的分布式计算体系结构 , 拥有一个大型计算平面、极高的带宽和低延迟、大型网络分区和映射等 , 并有一个新编译器来减少局部通信和全局通信 , 可扩展性强 。
Dojo项目负责人Ganesh Venkataramanan表示 , Dojo超级计算机将于明年投入使用 , 能够处理海量视频数据 。
马斯克曾表示 , 无数的边缘场景只能通过真实世界的视觉AI来解决 , 因为整个世界的道路就是按照人类的认知来建立的 。
超算Dojo内置特斯拉自研AI训练芯片D1 , 该芯片基于7纳米工艺制造 , 单个芯片算力为362TFLOPS , 包含500亿个晶体管 , 内部电路长达17.7公里 , 内建354个训练节点 。 其中25个D1芯片组成一个训练单元 , 一个训练单元的接口带宽每秒36TB , 算力达9 PFLOPS 。
事实上 , Dojo也可以看作是由训练模块组建而成的超级计算机 , 单个训练模块具备独立运行的能力 , 并且支持无限连接 。 “当所有力量被用来做成一件事 , 这就意味着自动驾驶汽车将成为可能 。 ”Venkataramanan表示 , Dojo是一台纯粹的学习机器 , 可以把 50 万个训练节点集合在一起 , 并且这仅仅是冰山一角 。
目前特斯拉机柜模型ExaPOD , 拥有120个训练单元、3000颗D1芯片、超过100万个训练节点 , 其BF16/CFP8算力高达1.1EFLOPS(每秒百亿亿级) 。 这使得Dojo成为一款真正的尖端超级计算机 , 目前在超级计算领域 , 包括英特尔以及其他科技公司 , 都在致力于突破每秒百亿亿次的计算速度 。
Venkataramanan表示 , 与业内其它计算机相比 , 在同样的功耗下 , Dojo的性能要比现有计算机强4倍 , 能效提升1.3倍 , 占用空间只有原来的五分之一 。 同时他表示 , 下一代Dojo的性能将再提升10倍 。
Dojo强大的计算能力 , 可以对车辆采集的海量视频数据进行识别、学习 , 这无疑将给特斯拉的视觉计算能力带来质的飞跃 。 在大幅提升算法效率的同时 , 也为实现L5级无人驾驶提供了技术支持 。
3
“那些无聊、危险的事 , 交给机器人去做”
或许 , 马斯克认为上述惊人的数据还不够炸裂 , 在特斯拉AI日 , 他还埋了一颗彩蛋 。
马斯克宣布 , 2022年特斯拉将推出一款名为Tesla Bot的机器人 , 它可以代替人类去完成一些危险的、重复的、又不得不做的任务 。 比如用扳手将螺栓固定到汽车上 , 或在商店里捡拾杂货 。
和机械感十足的波士顿动力公司打造的机器人Atlas不同 , Tesla Bot的外形和正常人类基本相同 。 它拥有人类的双手和双脚 , 四肢通过 40 个机电推杆 , 可以实现平衡 , 并完成一些敏捷的动作 , 移动速度5英里/小时(8公里/小时) , 机器人脸部有个屏幕可显示相关信息 。
从摄像头到神经网络 , 该仿生机器人将使用特斯拉车辆几乎所有的传感器 , 包括继承特斯拉的车机系统以及辅助驾驶系统等 。
在马斯克看来 , 机器人最终可能改变世界的运作方式 , 并且 , 最重要的是机器人不算“超级昂贵” 。
回顾整场发布会 , 特斯拉发布超级计算机、神经网络、人工智能训练芯片 , 有网友感叹“现实与科幻片里的场景越来越近” , 还有网友大呼 , “特斯拉 , 永远的神” 。 马斯克再一次向世人描绘了 , 一个真正的科技公司 , 该有的样子 。
【|马斯克:那些无聊且危险的事,交给机器人去做】(声明:本文仅代表作者观点 , 不代表新浪网立场 。 )

    推荐阅读