Agent

OpenAI新研究：o1增加推理时间就能防攻击，网友：DeepSeek也受益

OpenAI的新Scaling Law，含金量又提高了。像o1这样的推理模型，随着思考时间的延长，面对对抗性攻击会变得更加稳健。图片随着大语言模型被越来越多地赋予Agent能力，执行现实世界的任务，模型被对抗攻击的风险也与日俱增。

1/23/2025 2:53:15 PM

OpenAI亮剑自主Agent？网友犀利点评：鸡肋，这不Siri干的活吗？反驳：不要低估这项新功能，接管人类的智能体AI已在路上

编辑 | 星璇圣诞节12场直播过后，OpenAI终于在2025开年亮剑了一款新功能！美东时间1月14日周二，OpenAI宣布推出名为Tasks的测试版新功能，从周二开始，三个不同版本ChatGPT——ChatGPT Plus、Team和Pro的订阅用户将可以试用这个新功能。 Tasks这个功能有什么本领？

1/15/2025 1:42:17 PM

星璇

抢先OpenAI“虚拟员工”！清华复旦斯坦福联手，让Agent接管电脑帮你工作

抢先OpenAI的“Operator”，清华、复旦、斯坦福等研究者联合起来整了个大活～他们提出了一个名为“Eko”的Agent开发框架，开发者只需用简洁的代码和自然语言，就能快速构建可用于生产的“虚拟员工”：Agent可以接管用户的电脑和浏览器，代替人类完成各种任务。而这个操作，正是之前OpenAI被爆出的“Operator”所能实现的。爆料称OpenAI将会这个月发布“Operator”，现在直接被截胡了。

1/14/2025 12:22:10 PM

【LLM&Agent】PPTAgent：PPT自动生成Agent框架

来看一个PPT生成思路：PPTAgent。传统的PPT生成方法通常使用端到端的文本生成范式，这种方法仅关注文本内容，忽略了布局设计和PPT结构。 PPTAgent 采用了一种基于编辑的生成范式，解决处理空间关系和设计风格方面的挑战。

1/8/2025 3:15:16 PM

余俊晖

OpenAI发布新年目标，Agent智能体或将迎来百模大战

2025年1月1日，OpenAI CEO 奥特曼公布了公司的新年目标，涵盖AGI、智能体、4o升级、模型更好记忆、更长上下文等等。图片关于智能体，有网友爆料，OpenAI 可能在 1 月份发布一个名为 “operator” 的 Agent，这个 Agent 将具备直接控制电脑的能力。图片其实24年10月份的时候，Claude 就已经发布了基于 Claude 3.5 Sonnet 多模态大模型，可操作电脑的智能体。

1/3/2025 11:02:38 AM

渡码

AI时代下的挣钱思路：从消费到创收的转变

当年的时代阵痛是什么？对于许多人来说，意味着突如其来的失业与无助。四十多岁的人，因下岗而陷入困境，既要养家又缺乏一技之长，加上通货膨胀，钱不值钱，生活越来越艰难。

12/24/2024 8:34:36 AM

小普

NeurIPS 2024 | LLM智能体真能模拟人类行为吗？答案有了

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

12/11/2024 8:49:00 PM

机器之心

浅析面向场景的大模型应用框架选择

从demo到产品之间存在着鸿沟，大模型应用也是如此。在工程实践的时候，产品/服务提供的功能与性能及成本之间存在着大量的权衡，面向场景来选择大模型的应用框架，则是一种具体的权衡方法。例如，什么时候使用Agent？

12/9/2024 10:18:37 AM

曹洪伟

Scaling Law遭遇瓶颈，OpenAI被曝押注智能体“Operator”

继Anthropic之后，OpenAI也要接管人类电脑了？！就在刚刚，彭博社爆料OpenAI将在明年1月推出Agent“Operator（操作员）”，为用户自动执行任务。

11/14/2024 6:40:57 PM

把 AI 放进《我的世界》服务器：GPT-4o 杀牛宰羊，Claude3.5 把家拆了

把《我的世界》交给大模型，会怎么样？GPT-4o 鲨牛宰羊，Claude3.5 不停在人类身旁放炸药包和敌人，还把家拆了。GPT-4o mini 玩《我的世界》belike：来到游戏里面，GPT-4o mini（玩家 karolina）一开始还蛮礼貌的：你好世界！

10/21/2024 1:11:17 PM

清源

端到端优化所有能力，字节跳动提出强化学习LLM Agent框架AGILE

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]

9/30/2024 2:14:00 PM

机器之心

新「AI科学家」？MIT整合多智能体，实现材料科学研究自动化

编辑 | 萝卜皮人工智能（AI）的一个关键挑战是：如何创建能够通过「探索新领域」、「识别复杂模式」和「揭示海量科学数据中隐藏的联系」来自主推进科学理解的系统。在最近的工作中，麻省理工学院（Massachusetts Institute of Technology）原子与分子力学实验室（LAMM）的研究人员提出了 SciAgents，一种可以整合利用三个核心概念的方法：（1）使用大规模本体知识图谱来组织和互连不同的科学概念；（2）一套大型语言模型（LLM）和数据检索工具；（3）具有现场学习能力的多智能体（agent）

9/27/2024 5:41:00 PM

ScienceAI

OpenAI 朝 AI 第 3 阶段迈进，正招募人才组建“多智能体”团队

OpenAI 在发布 o1 AI 模型之后，下一步会怎么走？该公司研究员诺姆・布朗（Noam Brown）在 X 平台给出了答案，组建“多智能体”multi-agent 研究团队。根据 OpenAI 公布五级量表，最新推出的 o1 模型处于第二阶段，即所谓的“推理者”（reasoners），而开发 multi-agent 符合第三阶段的目标要求。OpenAI 的五级量表如下：第一级：聊天机器人，具有会话语言的人工智能第二级：推理者，解决人类水平问题的人工智能第三级：智能体，能够代表用户采取行动的人工智能第四级：创新

9/21/2024 12:10:50 PM

故渊

独角兽也卷不动了：AI Agent初创Adept被爆考虑出售

机器之能报道编辑：Sia越来越多的生成AI公司考虑加入出售的行列。据 Theinformation 消息，近几个月，AI 独角兽 Adept 领导层与科技巨头公司就出售或战略合作可能性进行了谈判。Adept 是一家由前 OpenAI 和谷歌 AI 开发人员创立的 AI 公司，专注于 AI Agent ，成立仅两年。Adept 去年 3 月完成新一轮融资后，估值已超 10 亿美元。消息人士称，Adept 曾与 Meta 接触，尽管收购的可能性不大。越来越多的生成 AI 公司在考虑出售可能性。AI 硬件公司 Human

5/24/2024 6:49:00 PM

机器之能

我为什么放弃了 LangChain？

如果你关注了过去几个月中人工智能的爆炸式发展，那你大概率听说过 LangChain。简单来说，LangChain 是一个 Python 和 JavaScript 库，由 Harrison Chase 开发，用于连接 OpenAI 的 GPT API（后续已扩展到更多模型）以生成人工智能文本。更具体地说，它是论文《ReAct: Synergizing Reasoning and Acting in Language Models》的实现：该论文展示了一种提示技术，允许模型「推理」（通过思维链）和「行动」（通过能够使用

7/23/2023 8:20:00 PM

机器之心

资讯热榜

苹果发布全新Xcode 26开发者工具：内置ChatGPT先进AI功能首月 1 美元，ChatGPT Team 会员美区 / 英区 / 欧洲区 / 澳洲区迎优惠 DeepSeek前高管秘密创业，新AI Agent项目已获顶级VC押注那个男人回来了！Ilya现身多伦多大学毕业典礼：AI 像是用数字方式复制出来的大脑！不管你愿不愿意，AI都将深刻影响你的一生！ ChatGPT 语音功能升级，实时翻译对话更自然流畅支持MCP！开源智能体开发框架 Rowboat：打造你的智能助手只需几分钟长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试谷歌 Gemini 应用月下载量超越 ChatGPT，用户活跃度仍显不足

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画数据谷歌机器人大模型 Midjourney 用户智能开源微软 GPT 学习 Meta 图像技术 AI创作 Gemini 论文马斯克 Stable Diffusion 算法代码英伟达 Anthropic 芯片生成式开发者蛋白质腾讯神经网络研究 3D 生成训练苹果计算智能体 Sora 机器学习 AI设计 AI for Science Claude GPU AI视频人形机器人华为搜索场景百度大语言模型 xAI 预测伟达深度学习 Transformer 字节跳动 Agent 模态具身智能神器推荐 LLaMA 文本视觉 Copilot 算力工具 LLM 驾驶 API 大型语言模型应用 RAG 亚马逊