AIGC宇宙 AIGC宇宙

谷歌 DeepMind 推出新 AI 模型,机器人未经训练也能执行现实任务

作者:清源
2025-03-12 11:22
北京时间今晚,谷歌 DeepMind 推出两款新型 AI 模型,旨在帮助机器人完成更多现实世界中的任务。

北京时间今晚,谷歌 DeepMind 推出两款新型 AI 模型,旨在帮助机器人完成更多现实世界中的任务

谷歌 DeepMind 推出新 AI 模型,机器人未经训练也能执行现实任务

其中一款名为 Gemini Robotics,是一款视觉语言行动模型,能够使机器人在没有进行过专门训练的情况下理解新的情境

Gemini Robotics 基于谷歌最新版本的 AI 旗舰模型 ——Gemini 2.0。谷歌 DeepMind 机器人部门高级总监 Carolina Parada 曾表示,Gemini Robotics 依托 Gemini 的多模态世界理解能力,通过加入物理行动的新模态,将其应用到现实世界中。

该模型在谷歌 DeepMind 认为构建高效机器人所需的三大核心领域取得了进展:通用性、互动性和灵活性。除了能够应对新的情境外,Gemini Robotics 在与人类及环境的互动上表现更好,且能够执行更精确的物理操作,比如折纸或打开瓶盖

谷歌 DeepMind 推出新 AI 模型,机器人未经训练也能执行现实任务

另一款则是 Gemini Robotics-ER(具象推理)模型,公司称其为一种先进的视觉语言模型,能够“理解复杂且动态的世界”。

Parada 进一步解释道,当你在装便当盒时,桌上的物品摆放位置和如何操作是你必须考虑的内容。Gemini Robotics-ER 正是为此类推理任务而设计,机器人专家可通过该模型与现有的低级控制系统对接,开启由 Gemini Robotics-ER 驱动的新功能。

谷歌 DeepMind 推出新 AI 模型,机器人未经训练也能执行现实任务

谷歌 DeepMind 的研究员 Vikas Sindhwani 表示,公司正在开发一种“分层安全策略”,并称 Gemini Robotics-ER 模型已被训练用于评估在特定情况下某个动作是否安全。公司还发布了新的基准和框架,推动 AI 领域的安全研究。据AI在线了解,去年,谷歌 DeepMind 推出了“机器人宪法”,这是一套受艾萨克・阿西莫夫启发的机器人行为规范。

据外媒 The Verge,谷歌 DeepMind 与 Apptronik 合作,共同致力于“打造下一代人形机器人”。此外,谷歌还向包括 Agile Robots、Agility Robotics、波士顿动力和 Enchanted Tools 在内的“受信任的测试者”开放了 Gemini Robotics-ER 模型。Parada 表示:“我们专注于打造能够理解物理世界并在其中行动的智能,我们非常期待将这一技术应用于多个领域和多种表现形式。”

相关资讯

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

最近,谷歌一口气对 AI 模型能力做了一次大升级,其中最吸引我的是 Gemini 2.0 Flash (Image Generation) ,这个模型对设计师来说,实用性很强。 更多新模型的介绍:. 被低估的谷歌?
3/26/2025 1:55:56 AM
彩云Sky

谷歌向 Pixel 9 /三星 Galaxy S25 推出 Gemini Live AI“实时拍摄”及识图导购助手功能

谷歌Gemini Live AI推出实时拍摄和识图导购功能,支持Pixel 9和Galaxy S25,可识别物体并比价购物。#谷歌AI##智能手机#
4/8/2025 7:36:23 AM
漾仔

91.1% 准确率,性能远超 GPT-4 系列模型,谷歌推出多模态医学大模型 Med-Gemini

编辑 | 萝卜皮各种复杂的医疗应用给人工智能带来了巨大挑战:需要先进的推理、获取最新的医学知识以及对复杂的多模态数据的理解。Gemini 模型在多模态和长上下文推理方面具有强大的通用能力,为 AI 在医学领域应用提供了可能性。基于 Gemini 的核心优势,谷歌的研究人员推出了 Med-Gemini,这是一个功能强大的多模态模型系列,专门用于医学,能够无缝使用网络搜索,并且可以使用自定义编码器有效地针对新颖的模态进行定制。研究人员用 14 项医疗基准评估 Med-Gemini,在其中 10 项上建立了新的最先进(S
5/7/2024 6:43:00 PM
ScienceAI
  • 1