铁了心为Agent开发铺路！OpenAI“真香”式升级：跳出Python圈、可人类干预、实时语音Agent、全链路追踪，代理福音

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）OpenAI 又放大招了！用实力正名：在AI圈，自己的“一哥”地位不可动摇！就在今天凌晨，OpenAI 官方开发者账号 @OpenAIDevs 在 X 平台上，一口气连续发布了 4 项关键更新，直接把 AI 代理（Agent）开发体验提升到新维度，围绕 Agent 开发体验、实时语音应用、人类干预机制和全链路追踪都做了重要升级。

编辑 | 云昭

出品 | 51CTO技术栈（微信号：blog51cto）

OpenAI 又放大招了！用实力正名：在AI圈，自己的“一哥”地位不可动摇！

就在今天凌晨，OpenAI 官方开发者账号 @OpenAIDevs 在 X 平台上，一口气连续发布了 4 项关键更新，直接把 AI 代理（Agent）开发体验提升到新维度，围绕 Agent 开发体验、实时语音应用、人类干预机制和全链路追踪都做了重要升级。

具体包括：推出了TypeScript 原生支持，语音代理可以实时跑，执行过程还能人工干预，全链路追踪也一站搞定。

别小看这 4 个更新，它们背后透露出的，OpenAI 对于 AI Agent 产品线的定位再升级：从“开发者玩具”，转向升级成为“企业级 AI 工具链”。

所以，今天这 4 个更新，哪怕你不写代码，也值得关注。我们这就来细细拆一下，告诉大家为什么这么说。

Agents SDK 正式跳出 Python 圈，支持 TypeScript，前端全栈开发者福音

过去，OpenAI Agents SDK 只提供 Python 版本，对大多数前端、全栈和 Node.js 开发者不太友好。

这次，官方直接放出了 TypeScript 版本 SDK，功能完全对齐 Python 版，支持：

handoffs（任务移交）
guardrails（安全机制）
tracing（执行追踪）
MCP（多通道代理控制）
以及 Agent 所需的各类基础能力。

安装也是非常简单：

复制

npm install @openai/agents

官网还给出了使用示例：

复制

import { Agent, run } from'@openai/agents';

const agent = new Agent({
name: 'Assistant',
instructions: 'You are a helpful assistant',
});

const result = await run(
  agent,
'Write a haiku about recursion in programming.',
);
console.log(result.finalOutput);

// Code within the code,
// Functions calling themselves,
// Infinite loop's dance.

可以说，OpenAI 的 AI Agent 终于从 Python 圈子里跳出来了，前端开发者也能玩转 AI 代理。

对 AI 工具 SaaS、智能客服、网页嵌入式 AI 助手这些场景是重大利好。

👉 官方文档：

https://openai.github.io/openai-agents-js/

新增 Human-in-the-loop 功能，AI 调用过程可人工干预

AI 黑箱执行、无法插手，一直是企业在部署 Agent 时最大的顾虑，尤其对于

金融风控、内容审核、法务审校这些场景，可控性尤其重要。

这一次，AI 不再是一锤子买卖，OpenAI贴心地将「人类介入权」被纳入了开发体系。

这次 SDK 增强了 Human-in-the-loop 功能，允许开发者：

在 Agent 调用工具或执行任务时，主动暂停
保存当前 agent 状态
让人工审核、确认或调整调用
再决定是否恢复执行

👉 功能指南：

https://openai.github.io/openai-agents-js/guides/human-in-the-loop/

实时语音 Agent 功能上线，实时语音代理可以跑了

第三个更新，相信适合所有在做各种 AI 助手的朋友，比如 AI 语音助手、客服机器人、播报应用等等，终于有了靠谱的官方方案。

图片

这次新出的 RealtimeAgent 功能，基于 OpenAI 的 Realtime API，可以让语音代理在本地客户端或服务器端实时运行，具体可以支持：

和文字 agent 一样的工具调用、任务移交、guardrails（护栏）
自动处理语音输入、输出、用户打断

👉 入门地址：https://openai.github.io/openai-agents-js/guides/voice-agents/

从“对话文字机器人”迈向“语音实时助手”，Agent 从文本应用进化到多模态 AI 产品，这是一个业内的共识和趋势，所以小编认为，OpenAI 这一次的功能真的很香！

这里也给大家放一个示例：

复制

import { z } from'zod';
import { RealtimeAgent, RealtimeSession, tool } from'@openai/agents/realtime';

const createTicket = tool({
name: 'createTicket',
description: 'Create a support ticket for a faulty laptop.',
parameters: z.object({}),
needsApproval: true,
execute: async () => 'Ticket filed!',
});

const faqAgent = new RealtimeAgent({
name: 'FAQ',
instructions: 'Answer laptop support questions concisely.',
});

const customerServiceAgent = new RealtimeAgent({
name: 'Customer Service',
instructions: 'Handle customer service inquiries, including support tickets.',
tools: [createTicket],
});

const triageAgent = new RealtimeAgent({
name: 'Triage',
instructions: 'Route laptop support questions to FAQ or customer service.',
handoffs: [faqAgent, customerServiceAgent],
});

const session = new RealtimeSession(triageAgent, {
model: 'gpt-4o-realtime-2025-06-03'
});

await session.connect({ apiKey });

Agent也有了抓手：Traces 仪表盘支持实时语音代理追踪

为了方便开发者监控 Agent 执行过程，OpenAI 的 Traces dashboard 现在也支持实时语音代理。

图片

可实时查看：

语音输入、输出
工具调用记录
用户打断情况
执行链路

这里值得注意的是，无论通过 API 还是 Agents SDK 调用，执行过程都能清晰追踪。

这也就意味着，企业彻查 Agent 的黑箱行为，也算是有了清晰的抓手。

写在最后：Agent 正在成为 AI 世界的操作系统

这 4 个更新看似琐碎，但放在一起，就是一个很清晰的信号：

AI Agent 不再是一个单点功能，而是正走向“全栈可控、支持语音、支持人类干预、过程全追溯”的企业级 AI 操作系统。

未来，客服、销售助理、内容审核、IoT 智能设备、企业运营辅助，这些场景里，AI Agent 不仅能实时跑，执行过程还能随时插手、随时追踪。

这意味着什么？

这就意味着，AI 正从“生成答案”，变成“执行任务”的超级数字劳动力。

而今天 OpenAI 的这波更新，正是为这个趋势铺路。

最后给大家看一下，最早一批尝鲜该功能的 Perplexity 开发的新品效果——

铁了心为Agent开发铺路！OpenAI“真香”式升级：跳出Python圈、可人类干预、实时语音Agent、全链路追踪，代理福音

参考资料：https://x.com/OpenAIDevs/status/1929950489539686901

铁了心为Agent开发铺路！OpenAI“真香”式升级：跳出Python圈、可人类干预、实时语音Agent、全链路追踪，代理福音

Agents SDK 正式跳出 Python 圈，支持 TypeScript，前端全栈开发者福音

新增 Human-in-the-loop 功能，AI 调用过程可人工干预

实时语音 Agent 功能上线，实时语音代理可以跑了

Agent也有了抓手：Traces 仪表盘支持实时语音代理追踪

写在最后：Agent 正在成为 AI 世界的操作系统

相关资讯

模型吞噬代码，Agent重构世界：当AI Agent与模型协同进化

全网爆火的Manus到底能做什么？超多演示案例来了！

速通BOSS需求！零基础AI Agent高效工作流设计指南