AIGC宇宙 AIGC宇宙

铁了心为Agent开发铺路!OpenAI“真香”式升级:跳出Python圈、可人类干预、实时语音Agent、全链路追踪,代理福音

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)OpenAI 又放大招了! 用实力正名:在AI圈,自己的“一哥”地位不可动摇! 就在今天凌晨,OpenAI 官方开发者账号 @OpenAIDevs 在 X 平台上,一口气连续发布了 4 项关键更新,直接把 AI 代理(Agent)开发体验提升到新维度,围绕 Agent 开发体验、实时语音应用、人类干预机制和全链路追踪都做了重要升级。

编辑 | 云昭

出品 | 51CTO技术栈(微信号:blog51cto)

OpenAI 又放大招了!用实力正名:在AI圈,自己的“一哥”地位不可动摇!

就在今天凌晨,OpenAI 官方开发者账号 @OpenAIDevs 在 X 平台上,一口气连续发布了 4 项关键更新,直接把 AI 代理(Agent)开发体验提升到新维度,围绕 Agent 开发体验、实时语音应用、人类干预机制和全链路追踪都做了重要升级。

具体包括:推出了TypeScript 原生支持,语音代理可以实时跑,执行过程还能人工干预,全链路追踪也一站搞定。

别小看这 4 个更新,它们背后透露出的,OpenAI 对于 AI Agent 产品线的定位再升级: 从“开发者玩具”,转向升级成为“企业级 AI 工具链”。

所以,今天这 4 个更新,哪怕你不写代码,也值得关注。我们这就来细细拆一下,告诉大家为什么这么说。

Agents SDK 正式跳出 Python 圈,支持 TypeScript,前端全栈开发者福音

过去,OpenAI Agents SDK 只提供 Python 版本,对大多数前端、全栈和 Node.js 开发者不太友好。

这次,官方直接放出了 TypeScript 版本 SDK,功能完全对齐 Python 版,支持:

  • handoffs(任务移交)
  • guardrails(安全机制)
  • tracing(执行追踪)
  • MCP(多通道代理控制)
  • 以及 Agent 所需的各类基础能力。

安装也是非常简单:

复制
npm install @openai/agents

官网还给出了使用示例:

复制
import { Agent, run } from'@openai/agents';

const agent = new Agent({
name: 'Assistant',
instructions: 'You are a helpful assistant',
});

const result = await run(
  agent,
'Write a haiku about recursion in programming.',
);
console.log(result.finalOutput);

// Code within the code,
// Functions calling themselves,
// Infinite loop's dance.

可以说,OpenAI 的 AI Agent 终于从 Python 圈子里跳出来了,前端开发者也能玩转 AI 代理。

对 AI 工具 SaaS、智能客服、网页嵌入式 AI 助手这些场景是重大利好。

👉 官方文档:

https://openai.github.io/openai-agents-js/

新增 Human-in-the-loop 功能,AI 调用过程可人工干预

AI 黑箱执行、无法插手,一直是企业在部署 Agent 时最大的顾虑,尤其对于

金融风控、内容审核、法务审校这些场景,可控性尤其重要。

这一次,AI 不再是一锤子买卖,OpenAI贴心地将「人类介入权」被纳入了开发体系。

这次 SDK 增强了 Human-in-the-loop 功能,允许开发者:

  • 在 Agent 调用工具或执行任务时,主动暂停
  • 保存当前 agent 状态
  • 让人工审核、确认或调整调用
  • 再决定是否恢复执行

👉 功能指南:

https://openai.github.io/openai-agents-js/guides/human-in-the-loop/

实时语音 Agent 功能上线,实时语音代理可以跑了

第三个更新,相信适合所有在做各种 AI 助手的朋友,比如 AI 语音助手、客服机器人、播报应用等等,终于有了靠谱的官方方案。

图片图片

这次新出的 RealtimeAgent 功能,基于 OpenAI 的 Realtime API,可以让语音代理在本地客户端或服务器端实时运行,具体可以支持:

  • 和文字 agent 一样的工具调用、任务移交、guardrails(护栏)
  • 自动处理语音输入、输出、用户打断

👉 入门地址:https://openai.github.io/openai-agents-js/guides/voice-agents/

从“对话文字机器人”迈向“语音实时助手”,Agent 从文本应用进化到多模态 AI 产品,这是一个业内的共识和趋势,所以小编认为,OpenAI 这一次的功能真的很香!

这里也给大家放一个示例:

复制
import { z } from'zod';
import { RealtimeAgent, RealtimeSession, tool } from'@openai/agents/realtime';

const createTicket = tool({
name: 'createTicket',
description: 'Create a support ticket for a faulty laptop.',
parameters: z.object({}),
needsApproval: true,
execute: async () => 'Ticket filed!',
});

const faqAgent = new RealtimeAgent({
name: 'FAQ',
instructions: 'Answer laptop support questions concisely.',
});

const customerServiceAgent = new RealtimeAgent({
name: 'Customer Service',
instructions: 'Handle customer service inquiries, including support tickets.',
tools: [createTicket],
});

const triageAgent = new RealtimeAgent({
name: 'Triage',
instructions: 'Route laptop support questions to FAQ or customer service.',
handoffs: [faqAgent, customerServiceAgent],
});

const session = new RealtimeSession(triageAgent, {
model: 'gpt-4o-realtime-2025-06-03'
});

await session.connect({ apiKey });

Agent也有了抓手:Traces 仪表盘支持实时语音代理追踪

为了方便开发者监控 Agent 执行过程,OpenAI 的 Traces dashboard 现在也支持实时语音代理。

图片图片

可实时查看:

  • 语音输入、输出
  • 工具调用记录
  • 用户打断情况
  • 执行链路

这里值得注意的是,无论通过 API 还是 Agents SDK 调用,执行过程都能清晰追踪。

这也就意味着,企业彻查 Agent 的黑箱行为,也算是有了清晰的抓手。

写在最后:Agent 正在成为 AI 世界的操作系统

这 4 个更新看似琐碎,但放在一起,就是一个很清晰的信号:

AI Agent 不再是一个单点功能,而是正走向“全栈可控、支持语音、支持人类干预、过程全追溯”的企业级 AI 操作系统。

未来,客服、销售助理、内容审核、IoT 智能设备、企业运营辅助,这些场景里,AI Agent 不仅能实时跑,执行过程还能随时插手、随时追踪。

这意味着什么?

这就意味着,AI 正从“生成答案”,变成“执行任务”的超级数字劳动力。

而今天 OpenAI 的这波更新,正是为这个趋势铺路。

最后给大家看一下,最早一批尝鲜该功能的 Perplexity 开发的新品效果——

铁了心为Agent开发铺路!OpenAI“真香”式升级:跳出Python圈、可人类干预、实时语音Agent、全链路追踪,代理福音

参考资料:https://x.com/OpenAIDevs/status/1929950489539686901

相关资讯

模型吞噬代码,Agent重构世界:当AI Agent与模型协同进化

大家好,我是肆〇柒。 AI 圈的进化速度之快,已是不争的事实。 去年,MCP(模型上下文协议)发布,随后 AI Coding 赛道愈发热闹,Cursor、Cline、Devin、MGX 等产品层出不穷。
5/29/2025 9:57:38 AM
肆零柒

全网爆火的Manus到底能做什么?超多演示案例来了!

关注科技 AI 圈的同学,在 3 月 6 号这天都被 Manus 刷屏了,那么他是个啥呢? 和 DeepSeek 和 Open AI 有什么区别呢? Manus 官网上是这样说的“Manus 是一个通用的人工智能代理,它连接思想和行动:它不仅会思考,还会提供结果。
3/11/2025 12:54:46 AM
益达

速通BOSS需求!零基础AI Agent高效工作流设计指南

此次会连载一套 AI-Agent 构建的系列,主要分为三部分,首先是速通 AI-Agent 构建的工作流基础,然后是通过 ComfyUI 作为案例来复盘如何快速上手工作流平台,最后则是借助 Agent 平台构建一个 AI Agent 案例,本系列意图主要是帮助大家贯通工作流的搭建形式,并尝试思考为自己的工作搭建一些可用的 AI 助手,或是提供构建的方法指引。 无论你是产品经理还是设计师,你会发现商业场景的 AIGC,几乎都没有办法通过一段需求描述或是简单的 Agent 对话就搞定的,你需要更专业更复杂的 AIGC 过程,那么如何理解复杂? 实现专业?
3/18/2025 8:22:14 AM
泡泡bing
  • 1