在算法中练习百年后，机器人的手能比你更灵活吗？

2018-08-06 20:18:33 8 Views

摘要： Dactyl AI的研究人员成功研究出一种自学算法，它能让机器人的手具有很高的灵活性。

Dactyl AI的研究人员成功研究出一种自学算法，它能让机器人的手具有很高的灵活性。他们研究出的算法使机器手能灵活地操纵一个立方体，这个过程在计算机模拟中相当于进行了百年的练习（尽管实际只有几天的时间）。

机器人的手还远不及人类的敏捷，而且如果想应用在工厂或仓库里也显得太笨拙了。即便如此，这项研究依然显示了机器学习的潜力。它还表明，有一天，机器人可能会在虚拟世界中自学新技能，这将大大加快编程或训练它们的进程。

这个机器人系统被称为“Dactyl”，是由位于硅谷的非营利组织OpenAI的研究人员开发的。它使用了一个来自英国公司称为“影子”的现成的机器手，一个普通的相机，以及一个已经掌握了一个庞大的多人在线视频游戏的DotA算法，它使用了同样的自学方法。

该算法使用一种称为强化学习的机器学习技术。Dactyl的任务是操纵一个立方体，把不同的面翻到上面来。通过不断的试错，会产生预期的结果。

视频显示，Dactyl能够非常敏捷地旋转立方体。它自动地找出了人类常用的几个抓点。但这项研究也显示了人工智能还有很长的路要走：在经过了数百年的虚拟训练之后，机器人成功地操纵了魔方的概率只有13/50，这远远超过了儿童所需要的时间。

麻省理工学院名誉教授、Rethink Robotics公司的创始人Rodney Brooks表示：“短期内，它不适合被应用于工业流程，但研究依然是一件好事。” Rethink Robotics公司是一家生产更智能工业机器人的初创公司。

强化学习的灵感来自于动物通过积极反馈学习的方式。它最初在几十年前就被提出了，但随着人工神经网络的进步，在最近几年才被证明是可行的。Alphabet旗下的DeepMind利用强化学习技术创建了AlphaGo。这是一个计算机程序，它学会了高超的技能来玩极其复杂和微妙的棋盘游戏。

其他机器人研究人员对这种方法进行了一段时间的测试，但由于模仿现实世界的复杂性和不可预测性，他们一直难有突破。OpenAI的研究人员通过在虚拟世界中引入随机变量来解决这个问题，这样机器人就可以学习如何解释诸如摩擦、机器人硬件噪音以及立方体部分处于视线之外的问题。

该机器人背后的工程师之一Alex Ray表示，通过赋予它更强的处理能力和引入更多的随机性，可以提高Dactyl的性能。“我认为我们还没有达到极限，”他说。Ray补充说，目前还没有计划将这项技术商业化。他的团队专注于开发最强的通用学习方法。

“这很难做好，”密歇根大学专门研究机器操纵的专家Dmitry Berenson说，“目前还不清楚最新的机器学习方法将会带来多大影响。我们付出了很多努力来为特定的任务提供合适的方法。”但他认为，模拟学习可能是非常有用的：“如果我们能够真正地跨越‘现实差距’，学习就会变得更加容易。

博域科技订阅号

博域科技服务号

文章分类