转载

OpenAI 2019年机器人研讨会

学习机器人是一条令人兴奋的前进道路,但对于如何取得进展有不同的方法和意见。该活动汇集了来自机器人和机器学习社区以及学术界和行业领导者的各种人士,创建了一个交流思想的平台,并解决构建复杂机器人系统的开放问题。

为什么举办这个活动?

学习的机器人是一项发展,将使机器人成为我们日常生活的一部分。虽然我们对如何实现这一目标有一些想法,但我们认为与其他组织和学科的人交流和讨论想法很重要。创造这些机器人本质上是一种多学科的方法——它不仅需要技术专长,还需要更深入地了解如何安全地部署这些机器人并在现实世界中与人类互动。

机器人研讨会上,四人围着带长凳的户外桌子聊天

参会人员

我们在办公室接待了 ~80 名外部与会者,全天有 ~200 人通过我们的直播远程加入。我们有来自谷歌、Facebook和NVIDIA等行业实验室的与会者,以及来自大学的学生、博士后和教授。斯坦福,加州大学伯克利分校,清迈大学麻省理工学院.人群中还有业余爱好者、艺术家、机器人专家和机器学习研究人员。

会谈

学习灵巧

沃伊切赫·扎伦巴, 开放人工智能

Wojciech谈到了我们最近的研究“学习灵活性”,该研究使用sim2real与域随机化和大规模强化学习与记忆增强策略。这种方法导致了元学习,允许我们的策略转移到物理机器人,而无需在机器人上进行训练。

从游戏中学习

皮埃尔·塞尔马内, 谷歌大脑

皮埃尔描述了游戏如何为表征学习提供自我监督。这种方法可用于获得各种技能,这些技能可用于和重新组合以解决新任务,而无需提供任何标签或奖励。

为我们的机器人做大自然为我们做的事

莱斯利·凯尔布林麻省理工学院

莱斯利解释了我们必须如何考虑在“机器人工厂”(即在工程时间)和“在野外”(即部署时)学习。Leslie描述了她构建智能机器人的整体架构,以及如何使用它来构建获得新技能的机器人。

将人视为人机交互中的优化者

安卡·德拉甘, 加州大学伯克利分校

Anca探讨了在学习人机交互时什么是归纳偏差的问题。她提出了一个预测人类行为的框架,该框架扩大了人类是噪声理性的假设,并允许战略性的人类行为,以及系统的次优性(例如不知道环境的确切物理特性,或者仍在了解他们的偏好)。

人机交互中的社会情商

李金柱, 麻省理工学院 / 亚马逊

Jin Joo深入探讨了通过社交情商使机器人栩栩如生和互动的原因和方式。这些社交机器人可以阅读和理解我们的情感表达,也可以以同样的方式与我们交流。

应该学习什么

克里斯·阿特克森, 清迈大学

Chris批判性地讨论了机器人学习研究和机器人编程实践之间的差距。他询问什么会让学习机器人真正有用,并概述了他关于如何实现目标的想法。

像自然动物一样适应的机器人

杰夫·克鲁恩, 优步人工智能 / 怀俄明大学

杰夫描述了他和他的合作者在《自然》杂志上发表的关于如何制造机器人的工作,这些机器人在运行时受到损坏时可以快速适应。所提出的方法最终可能导致机器人更能够适应损坏或意外的环境条件。

灵巧演示

由于活动在我们的办公室举办,我们借此机会进行了现场演示我们的人形机器人使用视觉和强化学习手动操纵一个块。

伸出的机械臂在机器人研讨会上解决手掌中的Rubrik立方体

我们很高兴向人们展示这只手,并让OpenAI机器人团队“随时”回答他们的问题!我们希望将来再次这样做,因为亲眼看到这是一种非常不同的体验。

研讨会演示范围

后续步骤

我们对活动的结果非常满意——这是一种实验性的形式,绝对超出了我们的预期。当天的会谈在我们的团队内部引发了有趣的讨论,并产生了一些新的想法(例如,自我监督)和观点(例如,传统机器人与深度学习机器人)。在与参与者和演讲者聊天后,很明显,每个人都觉得他们从这次活动中受益,并对解决相同问题的不同方法的多样性有了共同的理解。鉴于这些反馈,我们打算将来重复这种形式,可能作为年度研讨会。我们将在稍后分享有关即将举行的活动的详细信息。

如果您想帮助我们研究学习机器人,请与我们联系!我们正在招聘.

感谢Loren Kwan,Diane Yoon和Maddie Hall共同组织这次活动,感谢所有OpenAI员工志愿者,以及Blake Tucker的拍摄和摄影。