机器人

宇树机器人强化学习代码全面开源，还有训练到仿真和实操手把手教学

9.9万元起，还能够大规模量产的国产人形机器人，表现得实在是太6了：而且还走上了开源路线，就在刚刚，宇树机器人开源的强化学习代码又更新了！更新之后不再是只能训练——不仅能够仿真运行，还能部署到实体机器，整个过程所有代码全部开放。一开始，宇树开源的是英伟达Issac Gym平台上的训练代码，这次新增了对MuJoCo模拟仿真的支持。

12/17/2024 1:00:00 PM

量子位

英伟达团队机器训练新方法！仅5次演示让机器生成1000个新demo，李飞飞高徒与徒孙联手出品

人类只需要演示五次，就能让机器人学会一项复杂技能。英伟达实验室，提出了机器人训练数据缺乏问题的新解决方案——DexMimicGen。五次演示之后，DexMimicGen就可以直接模仿出1000个新的demo。

11/4/2024 3:30:00 PM

量子位

研究发现：AI 越聪明就越有可能“胡编乱造”

一项新研究发现，随着大型语言模型（LLM）变得越来越强大，它们似乎也越来越容易编造事实，而不是避免或拒绝回答它们无法回答的问题。这表明，这些更聪明的 AI 聊天机器人实际上变得不太可靠。图源 PexelsAI在线注意到，该研究发表在《自然》杂志上，研究人员研究了一些业界领先的商业 LLM：OpenAI 的 GPT 和 Meta 的 LLaMA，以及由研究小组 BigScience 创建的开源模型 BLOOM。研究发现，虽然这些 LLM 的回答在许多情况下变得更加准确，但总体上可靠性更差，给出错误答案的比例比旧模型更

9/29/2024 1:20:36 PM

远洋

如虎添翼，谷歌探索 AI + 机器人未来：836 平方米复杂场景下指令成功率高达 90%

感谢科技媒体 The Verge 昨日报道，谷歌旗下的 DeepMind 团队正在使用 Gemini 训练其机器人，让其能够完成更复杂的任务，且能在复杂的环境下自由穿梭。DeepMind 团队已经发表了最新的研究论文，利用 Gemini 1.5 Pro 的上下文窗口（达到 200 万个词元），让用户可以更轻松地使用自然语言指令与 RT-2 机器人互动。AI在线注：上下文窗口（context window）是指语言模型在进行预测或生成文本时，所考虑的前一个词元（token）或文本片段的大小范围。其工作原理是拍摄指定区

7/13/2024 9:09:12 AM

故渊

机器人大模型新公司！数据规模比同行大1000倍！贝索斯、孙正义等押注

机器之能报道编辑：Sia用 OpenAI 的方式颠覆机器人世界。「GPT-3 时刻正在进入机器人世界。」最近，Sequoia 合伙人 Stephanie Zhan 在投资了一家新机器人初创后说道。无论是在物流、车厂试点的人形机器人，还是四足机器狗，都要有脑子。过去，脑子要定制，「专款专用」，现在，不必了。最近，位于匹兹堡的机器人初创 Skild AI 声称，已经开发出一种通用的智能系统。它就像一个通用的智能模块，可以接入不同机器人，让他们立刻获得一些基本能力，如爬坡、跨过障碍、识别和捡起物品。7 月 9 日，Sk

7/12/2024 3:35:00 PM

机器之能

人形机器人将当上银行“大堂经理”，国内首个场景训练基地在上海浦东启用

据“上海金融官微”公众号，国内首个人形机器人银行大堂经理场景训练基地在建行上海浦东分行正式启用。银行大堂经理场景训练基地是业内首个商业银行场景应用训练基地，其首次采用开放式的创新训练模式，有助于加快提升人形机器人的能力，推动关键技术、重点产品和重点场景应用。据介绍，此次参训的机器人拥有高度仿生的躯干构型和拟人化的运动控制，结合视觉、听觉、语音等人工智能技术，科学家可以通过具身智能的推理和规划等对其进行训练。目前，该银行已对智能人形机器人开展银行大堂业务咨询、业务分流、智慧柜员机个性化操作指南、反欺诈宣传等面向客户的

7/11/2024 6:03:37 PM

清源

聊天机器人胡说八道？牛津研究人员利用语义熵来识破 AI“幻觉”

近年来，人工智能蓬勃发展，聊天机器人等应用逐渐普及，人们可以通过简单的指令从这些聊天机器人（例如 ChatGPT）获取信息。然而，这些聊天机器人仍然容易出现“幻觉”问题，即提供错误的答案，有时甚至是危险的信息。图源 Pexels造成“幻觉”的原因之一是训练数据不准确、泛化能力不足以及数据采集过程中的副作用。不过，牛津大学的研究人员另辟蹊径，在最新出版的《自然》杂志上详细介绍了一种他们新开发的方法，用于检测大型语言模型 (LLMs) 的“捏造” (即任意生成的不正确信息) 问题。LLM 通过在训练数据中寻找特定模式来

6/24/2024 8:25:46 AM

远洋

OpenAI重拾机器人梦想

机器之能报道编辑：文华如今，OpenAI 有钱有名有人才，是时候重拾机器人梦想了。OpenAI 正值多事之秋。先是安全团队愤而离职，再是寡姐指控其盗用声音，紧接着奥特曼遭前董事会成员背刺……历经一系列动荡，OpenAI 似乎挺沉得住气，最近还传出「重启机器人团队」的新消息。-1-OpenAI 重启机器人团队据《福布斯》援引知情人士的消息，OpenAI 正在招聘研究工程师，以重启四年前解散的机器人团队。报道称，尽管 OpenAI 尚未公开宣布其自主研发的机器人计划的细节，但在最近的招聘信息中解释说，新员工将成为团队

6/1/2024 4:57:00 PM

机器之能

OpenAI 重启机器人团队，联合多方回归老赛道

感谢福布斯报道称，随着对人工智能机器人投资的升温，OpenAI 正式重启其先前放弃的机器人团队，OpenAI 随后确认了这一消息。OpenAI 成立初期，机器人技术就是其主攻方向之一，联合创始人沃伊切赫・扎伦巴领导的团队最初试图打造一个“通用机器人”。2019 年，十多位 OpenAI 研究人员联合发表了一篇论文，描述了他们如何训练神经网络使用单只机械手复原魔方，并声称这是朝着训练机器人系统执行各种日常任务迈出的基础性一步。但在 2020 年 10 月，OpenAI 放弃了这一努力，扎伦巴将此归咎于缺乏训练数据。过

5/31/2024 3:09:51 PM

沛霖（实习）

人机交互大迈步，OpenAI GPT-4o 演示视频引热议：AI 之间也能聊天

OpenAI 昨日凌晨发布 GPT-4o 模型，可以视为 GPT-4 的升级版本，可以实时推理处理音频、视觉和文本内容，而且能更加无缝地和 ChatGPT 交互。OpenAI 总裁兼联合创始人格雷格・布罗克曼（Greg Brockman）随后发布了上手演示，让两台运行 GPT-4o 的设备进行语音或视频交互。布罗克曼在演示开始之前，表达了自己的期望：让两台 AI 聊天机器人互相交流。布罗克曼向其中 A 聊天机器人讲述了他的期望，并让 B 聊天机器人可以调用摄像头观察周围世界。B 聊天机器人会调用前置摄像头，并清晰地

5/15/2024 6:04:08 AM

故渊

你的助手你决定，谷歌推出 Gems 功能：由用户定制 Gemini 角色

谷歌公司在今天召开的 I / O 2024 开发者大会上，宣布为 Gemini 推出名为“Gems”的个性化选项，可以让用户定制 Gemini 助手角色。Gems 功能可以让用户迭代的聊天机器人，在保留指定特征的情况下帮助你完成某些任务。Gems 感觉类似于 OpenAI 的 GPT Store，可以让你制作定制的 ChatGPT 聊天机器人。该功能也有点像在 Character.AI 中创建自己的机器人，Character.AI 可以让你与虚拟的流行人物和名人甚至假冒的心理医生交谈。谷歌表示，用户通过 Gems

5/15/2024 3:12:28 AM

故渊

对话南佛罗里达大学孙宇教授：当大语言模型用于机器人任务规划丨IJAIRR

现代化社会，哪些工作场景最需要机器人的帮助？在工业领域，有著名的机器人“四大家族”——发那科、ABB、安川、库卡，经过百余年的发展技术越发成熟，在工业场景已经得到深入而广泛的应用。相比之下，生活场景中的服务型机器人历史则短得多。

3/15/2024 4:03:00 PM

乔燕薇

OpenAI 提供支持，Figure 01 人形机器人演示，网友：未来 5-10 年开启疯狂时代

感谢初创公司 Figure AI 今天发布一段新视频，展示了人形机器人 Figure 01 所具备的技能，网友在视频中留言：“未来 5-10 年绝对是一个疯狂的时代”。Figure 01 身高 167.64 厘米（5 英尺 6 英寸），重 59.8 千克（132 磅），最多可负重 20 千克（44 磅），移动速度为每秒 1.2 米（约每小时 2.7 英里）。Figure 01 最大的亮点在于利用 OpenAI 的大型语言模型，可以和人类进行正常的完整对话。由于 OpenAI 模型还支持多模态输入，因此可为 Figu

3/14/2024 8:11:11 AM

故渊

仅靠13页PPT，OpenAI投的这家人形机器人创业公司又融了1亿美元

机器之心报道编辑：杜伟不到一年时间，挪威人形机器人公司 1X 已经筹集到了超过 1.2 亿美元。还记得去年 OpenAI 领投的一家挪威机器人公司「1X」吗？当时该公司在 A2 轮融资中筹集到了 2350 万美元，由 OpenAI 创业基金领投、老虎环球以及一个挪威投资者组成的财团参投。今日，1X 官宣 B 轮融资筹集到 1 亿美元。作为一家 AI 和机器人公司，1X 的愿景是用机器人造福社会，满足全球劳动力需求。本轮融资方主要包括瑞典 EQT Ventures 风投基金和其他著名的全球投资者。1X 成立于 201

1/15/2024 10:12:00 AM

机器之能

大模型+机器人，详尽的综述报告来了，多位华人学者参与

大模型的出色能力有目共睹，而如果将它们整合进机器人，则有望让机器人拥有一个更加智能的大脑，为机器人领域带来新的可能性，比如自动驾驶、家用机器人、工业机器人、辅助机器人、医疗机器人、现场机器人和多机器人系统。预训练的大型语言模型（LLM）、大型视觉 - 语言模型（VLM）、大型音频 - 语言模型（ALM）和大型视觉导航模型（VNM）可以被用于更好地处理机器人领域的各种任务。将基础模型整合进机器人是一个快速发展的领域，机器人社区最近已经开始探索将这些大模型用于感知、预测、规划和控制等机器人领域。近日，斯坦福大学和普林斯

12/27/2023 2:45:00 PM

机器之心

类似 ChatGPT 的人工智能即将出现在主要科学搜索引擎中

编辑 | 白菜叶人工智能驱动的会话式聊天机器人已经出现在互联网搜索引擎中，例如谷歌的 Bard 和微软的 Bing，看起来也将越来越多地改变科学文献搜索方式。8 月 1 日，荷兰出版巨头 Elsevier 为其 Scopus 数据库的部分用户发布了由 ChatGPT 支持的 AI 界面，而英国公司 Digital Science 则宣布对其 Dimensions 数据库进行 AI 大语言模型 (LLM) 助手的封闭试验。与此同时，美国 Clarivate 公司表示，它也在努力将 LLM 纳入其 Web of Sci

8/6/2023 7:59:00 PM

ScienceAI

资讯热榜

苹果发布全新Xcode 26开发者工具：内置ChatGPT先进AI功能首月 1 美元，ChatGPT Team 会员美区 / 英区 / 欧洲区 / 澳洲区迎优惠 DeepSeek前高管秘密创业，新AI Agent项目已获顶级VC押注那个男人回来了！Ilya现身多伦多大学毕业典礼：AI 像是用数字方式复制出来的大脑！不管你愿不愿意，AI都将深刻影响你的一生！ ChatGPT 语音功能升级，实时翻译对话更自然流畅支持MCP！开源智能体开发框架 Rowboat：打造你的智能助手只需几分钟长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试谷歌 Gemini 应用月下载量超越 ChatGPT，用户活跃度仍显不足

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画数据谷歌机器人大模型 Midjourney 用户智能开源微软 GPT 学习 Meta 图像技术 AI创作 Gemini 论文马斯克 Stable Diffusion 算法代码英伟达 Anthropic 芯片生成式开发者蛋白质腾讯神经网络研究 3D 生成训练苹果计算智能体 Sora 机器学习 AI设计 AI for Science Claude GPU AI视频人形机器人华为搜索场景百度大语言模型 xAI 预测伟达深度学习 Transformer 字节跳动 Agent 模态具身智能神器推荐 LLaMA 文本视觉 Copilot 算力工具 LLM 驾驶 API 大型语言模型应用 RAG 亚马逊