谷歌推出了一种新的人工智能模型,该模型将允许人类与机器人交流,并通过将语言付诸行动来教他们该怎么做。
几十年来,机器人作为可靠助手的概念一直是我们集体想象的一部分。尽管有未来主义的愿景,但这些机器人助手的实际实现更多的是科幻小说而不是现实。
感谢 Google 的 DeepMind 研究团队,我们看到了一项激动人心的突破,它将重新定义机器人领域:推出 Robotics Transformer 2 (RT-2)。
RT-2 是一种开创性的视觉-语言-动作模型,使用基于 transformer 的技术开发,并根据从网络上收集的文本和图像数据进行训练。它的关键创新在于它能够直接输出机器人动作。从本质上讲,RT-2 从网络数据中学习一般概念和想法,然后应用这些知识来为机器人行为提供信息,从而有效地使机器人能够理解和“说”其操作语言。
现实世界中的机器人学习一直面临着巨大的挑战。为了让机器人在可变环境中执行一般任务,它必须管理复杂、抽象的任务,尤其是在以前从未遇到过的环境中。与聊天机器人不同,机器人需要扎根于现实世界。他们需要理解抽象概念,以及如何在实际的物理环境中应用它们。
从历史上看,机器人需要对数十亿个数据点进行训练,涉及物理世界中每个可以想象的物体、环境、任务和情况。对于创新者来说,这个过程既费时又费钱,而且往往不切实际。因此,机器人学习一直是一项艰巨的任务。
RT-2 代表了与传统机器人训练方法的重大背离。机器人技术的最新进展提高了机器人推理和剖析多步骤问题的能力,PaLM-E 等视觉模型可帮助机器人更好地了解周围环境。RT-1等先前的模型表明,Transformer 因其跨系统泛化信息的能力而得到认可,可以促进不同类型机器人的学习。
在 RT-2 之前,机器人依靠复杂的系统堆栈进行操作,其中高级推理和低级操作系统协同工作以使机器人发挥作用。这种繁琐的方法相当于在身体移动之前在心理上处理您想要采取的每一步。RT-2 通过将复杂的推理和动作输出结合在单个模型中来简化这一点。RT-2 的一个关键特征是它能够转移从其语言和视觉训练数据中得出的概念来指导机器人行动,即使对于它没有经过专门训练的任务也是如此。
以处理垃圾的任务为例。传统系统需要明确的培训来识别垃圾,捡起垃圾并将其扔掉。另一方面,RT-2 通过从大量网络数据中转移知识,已经了解了什么是垃圾,并且可以在没有明确培训的情况下识别它。它甚至可以理解如何在没有接受过培训的情况下处理垃圾。
RT-2 将信息转化为行动的能力使机器人能够快速适应新的情况和环境。在 6,000 多次机器人试验中,RT-2 在完成其训练任务时的表现与其前身 RT-1 一样好,同时在新颖的、看不见的场景中的表现几乎翻了一番——从 RT-32 的 1% 到 RT-62 的 2%。从这个意义上说,RT-2使机器人能够像人类一样学习,将以前学到的概念应用于新情况。
虽然在以人为本的环境中实现真正有用的机器人还有大量工作要做,但RT-2代表了对机器人技术诱人未来可实现的令人兴奋的一瞥。
RT-2 等模型的出现证明了人工智能的进步如何迅速影响机器人技术。它为开发更通用的通用机器人带来了巨大的希望。
关键词:
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
投诉邮箱:Email:133 46734 45@qq.com近年Meta推出的AI驱动广告工具Advantage+,是利用AI和自动化技术,帮助广告主提高营销及宣传效能。Meta副总裁兼货币化主管John Hegeman表
家乐福目前在其法国官网推出了 Hopla 购物资讯机器人,据称,该机器人基于 GPT-4 模型,顾客可以使用该机器人改善自...
Nvidia 席执行官黄仁勋表示,该公司的下一代人工智能 (AI) 芯片平台名为 Rubin,将于 2026 年推出。 黄仁勋在参加 Computex
根据用户反映,目前ChatGPT目前已停售Plus付费(20美元 月)服务,根据网站上OpenAI给出的理由,是需求量太大。 在今年...
英伟达公司于本周宣布推出一款名为 Neuralangelo 的 AI 模型,该模型能够将视频片段转化为细节层次丰富、具备贴图的 3D 模型。
OpenAI宣布其新版人工智能模性GPT-4o之后,Anthropic随即宣布其人工智能服务Claude已经正式进驻欧洲市场,并且对应法语、德语...
近日,CNMO注意到,根据企查查APP提供的信息,浙江未来精灵人工智能科技有限公司正式成立。这家新成立的公司由XGenie Ho...
傅利叶智能宣布战略升级,正式切入到万亿级通用机器人赛道。在刚刚过去的2023世界人工智能大会上,傅利叶智能的最新产品...
科大讯飞星火认知大模型V2 0正式发布,重点发布代码能力和多模态能力,并推出面向老师、学校、企业、开发者等更多元的应...
在此次re:Invent 2023大会上,AWS宣布与英伟达扩大合作,通过导入下一代GPU、CPU与人工智能软件,推动生成式人工智能创...
Elon Musk旗下人工智能新创公司X ai宣布,其自动生成式人工智能模型Grok将升级至1 5版本。Grok-1 5将改进其推论能力,使...
印度美食推荐、外卖平台 Zomato 推出 Zomato AI,这种创新工具超越了传统的聊天机器人,旨在成为个性化美食伴侣。 ...
谷歌母公司 Alphabet 旗下投资公司 CapitalG 近日宣布,向 AI 市场情报公司 AlphaSense 投资 1 亿美元(当前约 6 89 亿元人
Menteebot 是 Mentee Robotics 的新产品,它是一款专为家庭或商业用途设计的人类大小的机器人,将人工智能技术提升到了一个全新的水平
近段时间ChatGPT带火了AI领域,尤其是极为聪明的对话逻辑和知识体系,简直秒杀了以往的AI助手等产品。 根据最新消息,...
在推动诸多结合Copilot服务应用的人工智能技术之后,微软也因应越来越多工作人员、职场经理人有更大使用人工智能意愿,在Link...
谷歌的 AI 聊天工具 Bard 此前支持语言有限,最初只支持英语,后来支持了韩语和日语等,而当下 Bard AI 已经更新了中文环境,可
日前微软研究人员展示了 LLaVA-Med 模型,该模型主要用于生物医学方面的研究,可根据 CT、X 光图片等推测出患者的病...
Anthropic稍早宣布推出其升级版本人工智能模型Claude 3 5 Sonnet,以及全新名为Claude 3 5 Haiku的人工智能模型,另外更宣布推出可
IDC 中国今日表示,OpenAI 陆续发表 ChatGPT、GPT-4,引发人工智能界全民狂欢,文生图类应用如 StableDiffusion、Midjourney 及
继发布依据一段文字描述可自动生成60秒影片的Sora杀手级AI 模型后,OpenAI 日前首次公开旗下历经近2年开发的Voice EngineAI声音模型新技