谷歌“云机器人”成为机器人的技能导师
2016-10-19 11:33:42   来源:Newatlas
内容摘要
人类可以通过语言和示范动作来与其他人分享我们的经验和专业知识,而机器人也有可能通过网络传输信息来互相学习他们所有的技能。谷歌研究人员正在利用这种“云机器人”来帮助机器人更快地获得技能。

诗人John Donne曾说,“没有人便是一座孤岛,”这对于机器人来说更是如此。我们人类可以通过语言和示范动作来与其他人分享我们的经验和专业知识,而机器人也有可能通过网络传输信息来互相学习他们所有的技能。如今,谷歌研究人员正在利用这种“云机器人”来帮助机器人更快地获得技能。

人类的大脑有数十亿的神经元,它们之间形成了一个深不可测的连接数。当我们思考和学习的时候,神经元相互作用,针对有奖励的某些途径将会随着时间而被强化,使得那些途径更可能在未来再次被选择,教导我们并塑造我们的行为。

人工神经网络遵循人类的神经网络,具有较小的规模,相似的结构。机器人可以被赋予任务并被指示采用试验和错误来确定实现它的最佳方式。早期,它们的行为在外部观察者看来完全是随意的,但是通过尝试不同的事情,随着时间的推移,它们将学习到哪些行为使它们更接近它们的目标,并且着重练习那些行为,不断提高自己的能力。

虽然很奏效,但是云机器人入门这个过程是很耗时的。并不是每一个机器人单独经历这个实验阶段,而是它们的集体经验可以共享,允许一个机器人有效地教另一个机器人如何执行简单的任务,如开门或者移动物体等。这些机器人会定期地将它们学到的东西上传到服务器,并下载最新版本,这意味着每个机器人都将比它们通过个体经历获得的知识库更全面。

通过使用这种基于云的学习,Google研究小组开展了三种不同类型的实验,以不同的方式教育机器人,找到最有效和最准确的方法来建立一个常见的技能模型。

首先,在共享神经网络的多个机器人被安排任务,即只通过试验和错误来打开门。一开始,它们似乎在按照它们的探索行为盲目地摸索着,找出那些让它们更接近目标的方式。

经过几个小时的实验,机器人共同研究出如何打开门的行为。它们明白这些行为会引导成功,研究人员不必建立一个如何成功的明确的程序模型。

在第二个试验中,研究人员测试了一个预测性模型。机器人被给一个充满日常摆弄物品的托盘,当它们推动或戳动这些物品,它们会对其中的因果有一个基本的理解。再触碰一次,它们的发现会被共享,然后它们会用它们不断改进的因果模型来预测哪些行动将导致哪些结果。

研究人员使用显示测试区域的计算机界面通过点击对象以及位置来告诉机器人在哪里移动对象。利用已知的期望效果,机器人可以利用其共享的过去的经验来找到实现该目标的最佳动作。

该研究的意义在于,对于神经网络来说,数据越多越好,所以一个机器人团队同时相互学习传教比单个机器人单独工作可以产生更好的结果。因此,加快这项研究的进程为机器人更快了解更复杂的任务开启了一扇大门。

(如需转载,请注明来源自 科技世界网