AI|MIT机械手新研究:玩转2000多个物体 球体成功率近100%( 二 )



AI|MIT机械手新研究:玩转2000多个物体 球体成功率近100%
文章图片


▲MIT CSAIL研究团队的机械手演示动画(GIF来源为GitHub)
二、从零重力到正常条件,机械手性能提高
MIT CSAIL博士生、Improbable AI Lab研究小组首席研究员陈涛(Tao Chen)说:“在工业中,由于控制简单,最常用的是平行爪夹持器,如下图所示 。但实际上它无法处理我们在日常生活中看到的许多工具 。即使用该夹持器控制钳子也很困难,因为它不能灵活地只移动其中一个手柄 。我们的程序框架将允许多指机械手灵巧地操纵此类工具,这为机械手应用开辟了一个新领域 。”

AI|MIT机械手新研究:玩转2000多个物体 球体成功率近100%
文章图片


▲平行爪夹持器(图片来源为YouTube)
机械手操纵物体时需要控制大量电机,并且手指与物体之间的接触状态也在频繁变化,因此,机械手重置物体方向一直是一个具有挑战性的技术难题 。该程序框架需要通过2000多个对象进行学习 。
当机械手朝下时,问题就变得更加棘手 。机械手不仅需要操纵物体,还需要克服重力使其不会掉落 。

AI|MIT机械手新研究:玩转2000多个物体 球体成功率近100%
文章图片


▲机械手朝下时操纵物体(GIF来源为GitHub)
该团队发现一种简单的方法可以解决复杂的问题 。他们使用了深度学习的无模型强化学习算法,意味着该程序框架必须从与环境的交互中找出价值函数,以及所谓的“师生”训练方法 。
为此,研究人员利用物体和机械手的信息对“教师”网络进行训练,这些信息无法在现实世界中获得,只能在模拟环境中获得,例如指尖的位置或物体移动速度 。
为了确保机械手可以在模拟环境之外工作,“教师”网络学习到的内容将被提炼为现实世界中可以获取的观察结果,并提供给“学生”网络,例如摄像机捕获的深度图像、物体姿态和机械手的关节位置 。
他们还使用了“重力课程”的学习方法,机械手首先在零重力环境中学习技能,然后慢慢地让控制器适应正常的重力条件,以这种形式训练机械手确实提高了其整体性能 。
看似不是正常的学习过程,但被称为机械手“大脑”的单个控制器可以通过这种训练方法重新放置大量物体,即使这些物体它以前从未见过并且不知道形状 。
三、机械手成功率受物体形状制约
麻省理工学院教授、该研究论文作者Pulkit Agrawal说:“我们最初认为,在机械手操纵物体时推断形状的视觉感知算法将是主要挑战 。相反,我们的结果表明,机械手可以学习与形状无关的强大控制策略 。这表明视觉感知对于操纵的重要性可能远不如我们习惯的思维方式重要,而更简单的感知处理策略可能就足够了 。”

推荐阅读