研究人员通过人工智能技术改善了机器人手臂的控制
309
超过一百万的美国成年人使用装有机器人手臂的轮椅来帮助他们完成日常工作,如穿衣、刷牙和吃饭。但是现在市场上的机器人设备很难控制。从冰箱中取出食品容器或打开柜门可能需要很长时间。而用机器人给自己喂食更是难上加难,因为这项任务需要精细的操作。
斯坦福大学的一个研究小组现在已经开发出一种新的控制辅助机械臂的方法,这种方法比现有的方法更直接、更快速。在实验中,他们的机器人控制器可以让受试者更有效地切豆腐并将其铲到盘子上,或者刺穿棉花糖,将其舀入糖衣。
Sadigh的团队,包括工程学研究生洪俊全(Hong Jun Jeon)和计算机科学博士后学者Dylan P.Losey,开发了一种混合了两种人工智能算法的控制器。第一种是由Sadigh的小组开发的,可以在操纵杆上进行二维控制,而不需要在模式之间切换。例如,它使用上下文提示来确定用户是伸手去握门把手还是拿酒杯。然后,当机器人手臂接近目的地时,第二种算法开始工作,允许更精确的移动,控制权由人和机器人共享。
目前市场上典型的辅助机器人有6-7个关节。Sadigh说,要控制每一个,用户都要在操纵杆上的各种模式之间切换,这既不直观,又让人精神疲惫,而且需要很多时间。
研究小组想知道:一个只在两个方向(上/下;左/右)发出指令的操纵杆能否平稳、快速地控制多关节机器人?为了得到答案,他们求助于一种叫做维数缩减的过程。在任何给定的环境中,机器人手臂实际上并不需要向每个可能的方向移动每个关节来完成特定的任务。一组较小的动作通常就足够了。”Sadigh解释说:“关键的一点是,在特定的限制条件下,机器人会知道,向右推操纵杆意味着一件特定的事情,比如拿起杯子。”
降维的过程始于人类通过各种特定任务的运动来移动机器人手臂,基本上是训练它如何在给定的环境中以更流畅和有用的方式移动。然后,这个高维数据集通过神经网络(自动编码器)输入,神经网络首先将数据压缩成两个维度,然后解码压缩后表达,试图重新创建最初的数据。”这就是你如何确保压缩工作的方式,因为它能够重现数据,”萨迪格说。
下一步就是奇迹发生的地方:一个人在操纵杆上发出二维指令,机器人就能重新创造出更复杂、更依赖上下文的动作,而专家训练它去做这些动作。在实验中,当用户单独用这种“潜在动作”算法控制机器人时,他们可以捡起一个鸡蛋、一个苹果和一杯面粉,然后把它们扔到碗里(可以说是做一个“苹果派”)的速度,要快于现有的需要在操纵杆上切换模式的方法。尽管速度提高了,但用户发现界面不可预测。”它做了正确的事情,但用户不知道为什么。
增加自动共享
潜在的动作控制器不是很精确。为了解决这个问题,这个团队将潜在的动作算法和一个叫做自动共享的算法混合在一起。在这方面,创新之处在于团队整合了这两种算法。”“这不是一个附加功能,”萨迪格说整个系统是一起训练的。”
在自动共享中,机器人从一组控制器告诉它做什么的“信念”开始,并随着附加指令的发出而获得对目标的信心。因为机器人实际上并不是有知觉的,所以这些信念只是概率而已。例如,面对两杯水,一个机器人可能会从一开始就认为它应该有均等的机会去接其中一个。但是,当操纵杆引导它朝向一个杯子而远离另一个杯子时,机器人就获得了对目标的信心,并开始接管与用户共享的自主权,从而更精确地控制机器人手臂。Sadigh解释说,机器人所承担的控制量也是概率性的:如果机器人有80%的信心相信自己会赢得A杯而不是B杯,那么它将获得80%的控制权,而人类仍有20%的控制权。
为了测试集成算法,研究小组进行了实验,让用户控制装有叉子的机器人手臂。他们的任务:切开并舀豆腐,或刺棉花糖,舀在糖衣里。结果表明:采用混合算法(具有自动共享的潜在动作)的控制器,无论是单独的还是自动共享的,都比单独使用动作算法或标准控制器的控制速度更快,更容易控制。
Jeon说,在研究小组的成果在改变残疾人的生活之前,还有很多工作要做。该系统将需要接受培训,以使用计算机视觉,并在许多环境下发挥作用。最终应该有一项研究,让大量的残疾人有机会测试控制器。从长远来看,希望基于人工智能的辅助机器人技术能让残疾人的生活更轻松。”
参考文献:Shared Autonomy with Learned Latent Actions. Robotics: Science and Systems. www.roboticsproceedings.org/rss16/p011.pdf。