当前位置:首页 > 人工智能 > >

谷歌RT-2 AI模型:离机器人更近一步 可以像人类一样学习

谷歌RT-2 AI模型:离机器人更近一步 可以像人类一样学习
2023-12-01 17:19:59 来源:聚焦媒体网

  谷歌推出了一种新的人工智能模型,该模型将允许人类与机器人交流,并通过将语言付诸行动来教他们该怎么做。

  几十年来,机器人作为可靠助手的概念一直是我们集体想象的一部分。尽管有未来主义的愿景,但这些机器人助手的实际实现更多的是科幻小说而不是现实。

  感谢 Google 的 DeepMind 研究团队,我们看到了一项激动人心的突破,它将重新定义机器人领域:推出 Robotics Transformer 2 (RT-2)。

  RT-2 是一种开创性的视觉-语言-动作模型,使用基于 transformer 的技术开发,并根据从网络上收集的文本和图像数据进行训练。它的关键创新在于它能够直接输出机器人动作。从本质上讲,RT-2 从网络数据中学习一般概念和想法,然后应用这些知识来为机器人行为提供信息,从而有效地使机器人能够理解和“说”其操作语言。

  现实世界中的机器人学习一直面临着巨大的挑战。为了让机器人在可变环境中执行一般任务,它必须管理复杂、抽象的任务,尤其是在以前从未遇到过的环境中。与聊天机器人不同,机器人需要扎根于现实世界。他们需要理解抽象概念,以及如何在实际的物理环境中应用它们。

  从历史上看,机器人需要对数十亿个数据点进行训练,涉及物理世界中每个可以想象的物体、环境、任务和情况。对于创新者来说,这个过程既费时又费钱,而且往往不切实际。因此,机器人学习一直是一项艰巨的任务。

  RT-2 代表了与传统机器人训练方法的重大背离。机器人技术的最新进展提高了机器人推理和剖析多步骤问题的能力,PaLM-E 等视觉模型可帮助机器人更好地了解周围环境。RT-1等先前的模型表明,Transformer 因其跨系统泛化信息的能力而得到认可,可以促进不同类型机器人的学习。

  在 RT-2 之前,机器人依靠复杂的系统堆栈进行操作,其中高级推理和低级操作系统协同工作以使机器人发挥作用。这种繁琐的方法相当于在身体移动之前在心理上处理您想要采取的每一步。RT-2 通过将复杂的推理和动作输出结合在单个模型中来简化这一点。RT-2 的一个关键特征是它能够转移从其语言和视觉训练数据中得出的概念来指导机器人行动,即使对于它没有经过专门训练的任务也是如此。

  以处理垃圾的任务为例。传统系统需要明确的培训来识别垃圾,捡起垃圾并将其扔掉。另一方面,RT-2 通过从大量网络数据中转移知识,已经了解了什么是垃圾,并且可以在没有明确培训的情况下识别它。它甚至可以理解如何在没有接受过培训的情况下处理垃圾。

  RT-2 将信息转化为行动的能力使机器人能够快速适应新的情况和环境。在 6,000 多次机器人试验中,RT-2 在完成其训练任务时的表现与其前身 RT-1 一样好,同时在新颖的、看不见的场景中的表现几乎翻了一番——从 RT-32 的 1% 到 RT-62 的 2%。从这个意义上说,RT-2使机器人能够像人类一样学习,将以前学到的概念应用于新情况。

  虽然在以人为本的环境中实现真正有用的机器人还有大量工作要做,但RT-2代表了对机器人技术诱人未来可实现的令人兴奋的一瞥。

  RT-2 等模型的出现证明了人工智能的进步如何迅速影响机器人技术。它为开发更通用的通用机器人带来了巨大的希望。

关键词:

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

投诉邮箱:Email:133 46734 45@qq.com

相关新闻