理论

OpenAI新模型，被曝秘密训练中！万字硬核长文直指o4核心秘密

OpenAI的o4，已经在训练了？就在最近，SemiAnalysis发表了一篇硬核长文博客，爆料了不少大模型圈的内幕消息。其中，一些最核心的亮点，先一睹为快：OpenAI正在训练一个规模介于GPT-4.1和GPT-4.5之间的新模型下一代推理模型o4将基于GPT-4.1展开RL训练强化学习改变了实验室结构，甚至是大厂未来研究的侧重方向和优先级定义奖励函数难上加难，往往AI钻空子之后，漏洞才能被发现不牺牲LLM任何性能，不用合并权重，RL另一条路——数据混合与预训练不同，RL可持续更新Scaling模型能力，DeepSeek-R1是典例高质量数据是Scaling强化学习的护城河训练小模型，蒸馏效果要比RL更好新一轮预训练已开始首先，让我们看看其中最硬的内容——关于OpenAI的全新模型。

6/11/2025 8:54:52 AM

OpenAI年化收入突破100亿美元过去一年亏损约50亿美元

在人工智能领域，OpenAI无疑是一颗耀眼的明星。自2022年底推出ChatGPT聊天机器人以来，短短不到三年时间，其年经常性收入（annual recurring revenue, ARR）便实现了惊人的飞跃，达到了100亿美元。据OpenAI方面透露，这100亿美元的年经常性收入涵盖了公司消费者产品、ChatGPT企业产品以及应用程序接口（API）的销售所得。

6/10/2025 4:24:59 PM

小菲

“程序员炸锅”！Claude一夜撤离 Windsurf，OpenAI 收购遭"精准狙击"

本月初，Anthropic 悄然切断 Claude 3.x 模型在 Windsurf 平台上的接入，直接影响其免费与 Pro 试用用户。 Windsurf的官方消息事情发生得很快。 6 月 4 日，Windsurf 收到 Anthropic 的正式通知：Claude 3.x 系列模型将在不到一周后全面停止服务。

6/10/2025 4:19:54 PM

60%情况下，主流大模型没理解风险只是装懂！别被模型的“安全答案”骗了

让推理模型针对风险指令生成了安全输出，表象下藏着认知危机：即使生成合规答案，超60%的案例中模型并未真正理解风险。换句话说，主流推理模型的安全性能存在系统性漏洞。针对此种现象，淘天集团算法技术-未来实验室团队引入「表面安全对齐」（Superficial Safety Alignment, SSA）这一术语来描述这种系统性漏洞。

6/10/2025 11:25:06 AM

斯坦福NYU联合研究：AI和人类思维差异的惊人发现 —— 为什么大模型"聪明"却不够"智慧"？

1、一个令人深思的认知谜题想象一下这样的场景：你和ChatGPT都被要求对一堆动物进行分类。你可能会说"鸟类里，知更鸟是典型代表，而企鹅有点特殊"，而AI却可能简单粗暴地把所有有翅膀的都归为一类。表面上看，你们的分类结果差不多，但背后的思维逻辑却天差地别。

6/10/2025 11:22:38 AM

无影寺

七种方式让你的AI编码结果更靠谱

译者 | 核子可乐审校 | 重楼企业在积极引入AI的同时，也希望雇用更多工程师，期望开发者能够借AI之力将产出“提升10倍”。但要真正高效运用AI编码助手，其中也有不少门道。首先是AI编码助手的固有局限，其存在大量不确定性，因此容易引发种种难以避免的意外行为，例如随机删除代码或引入逻辑错误。

6/10/2025 8:30:50 AM

核子可乐

多模态推理模型（LMRM）：从感知到推理的演变

大家好，我是肆〇柒。当下，人工智能正以前所未有的速度改变着我们的生活与工作方式。其中，推理作为人工智能的核心能力之一，赋予了智能体在复杂环境中做出决策、得出结论以及进行知识泛化的能力。

6/10/2025 3:30:00 AM

肆零柒

奥特曼ChatGPT用法错了！最新研究：要求“直接回答”降低准确率，思维链提示作用也在下降

奥特曼使用大模型的方法，竟然是错的？来自沃顿商学院等机构的最新研究发现，备受奥特曼喜爱的“直接回答”提示，竟然会显著降低模型准确率。图片不过另一方面，这项研究也发现，在提示词中加入思维链（CoT）命令同样不好用——CoT提示对于推理模型非但没有效果提升，反而会增加时间和计算成本。

6/9/2025 3:26:53 PM

高考作文“抽象”上热搜，大模型来战能拿几分？

6月7日上午，2025年全国高考正式拉开帷幕。首场语文考试结束后，作文题目便迅速成为众人讨论的焦点。有网友表示，今年的高考作文太难了，甚至是有些抽象。

6/9/2025 3:23:26 PM

那个男人回来了！Ilya现身多伦多大学毕业典礼：AI 像是用数字方式复制出来的大脑！不管你愿不愿意，AI都将深刻影响你的一生！

编译 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）Ilya终于出现了！自从OpenAI宫斗风波之后，这位GPT背后的技术灵魂便鲜少露面。甚至，where is Ilya的各种阴谋论一度成为整个AI圈的热梗。

6/9/2025 1:48:59 PM

伊风

图灵奖得主、AI教父Bengio：我改变了科研方向，哪怕与此前信念背离，也要尽己所能降低AI失控的灾难风险；AGI最快五年降临

编辑｜云昭6月6日，年逾花甲的三大“AI教父”之一的Yoshua Bengio（小编心中的科研偶像之一），如约出现在2025智源大会上的现场荧幕中。大师眼中的GPT究竟是什么样子？我们又该打造怎样的AI？

6/9/2025 8:39:10 AM

云昭

OpenAI 全新 Codex AI 代理或将终结传统 IDE 时代

OpenAI 推出的最新 Codex AI 代理堪称革命性突破。它与目前市面上的 Windsurf、Cursor 等智能代理工具完全不同，属于全新层次。只需看它如何自主修复项目中的多个 BUG——没有任何人工干预，轻松解决了37个问题。

6/9/2025 8:11:34 AM

前端小智

六大模型决战高考数学新一卷：豆包、元宝并列第一，OpenAI o3竟惨败垫底

又是一年高考时。这届考生上午刚经历了抽象作文的洗礼，下午又被数学无情创飞。考试一结束，「高考数学」、「新一卷数学大题难」等词条就火速冲上微博热搜，考生们在评论区集体「哀嚎」：「大题写到怀疑人生」、「选择填空送分，大题送命」。

6/8/2025 12:23:06 PM

机器之心

Dify工具插件开发和智能体开发全流程实战

前言Dify是一款开源的大语言模型应用开发平台，旨在降低AI应用的开发门槛，帮助开发者和企业快速构建、部署及管理生成式AI应用。 Dify自1.0.0引入全新插件化架构，模型（Models）与工具（Tools）迁移为插件（Plugins），引入 Agent 策略（Agent Strategies）、扩展（Extensions）类型插件和插件集（Bundles）。通过全新的插件机制，能够增强 AI 应用的感知和执行能力，拓宽AI在软件操作领域的应用能力。

6/6/2025 10:01:25 AM

AI大模型应用开发

AI Agent 产品交互设计：设计模式与案例分析

作者 | 贾思玉、亢江妹或许你还记得 ChatGPT 问世时的轰动，第一次使用 DeepSeek R1 的兴奋和激动也历历在目。 AI Agent 发展一日千里，今年以来，几乎每个月都有新的 AI Agent 产品发布，现有产品也不断更新换代，让人目不暇接。本文将从体验设计视角，来看看当下热门的 AI Agent 产品，如 Manus、Flowith、Gemini Deep Research、Cursor、Devin 等，分析 Agent 产品面临的设计挑战，探讨有效的交互设计模式，以及如何打造高效、易用、友好的 Agent 交互体验。

6/6/2025 9:46:57 AM

Thoughtworks洞见

危险？OpenAI 模型行为负责人：人类很快会进入「AI意识」，当前最重要是控制人机关系的影响

AI是否真的有意识？ ChatGPT最近越来越懂你了？ OpenAI模型行为与政策负责人Joanne Jang刚刚写了一篇长文，她并未纠缠于“AI是否真的有意识”这个哲学难题，而是提出了一个更具现实意义和紧迫性的视角：与其争论AI的“本体”，不如关注它对人类“情感福祉”的实际影响。

6/6/2025 9:15:52 AM

LLM 协作革命：Group Think 如何重塑推理边界

大家好，我是肆〇柒。今天和大家聊聊 Group Think。顾名思义，它通过让单个 LLM 模拟多个并行推理智能体，并以 token 级别的细粒度协作，提出了推理协作的新范式。

6/6/2025 8:57:42 AM

肆零柒

OpenAI付费企业用户猛增至300万直击微软谷歌AI腹地

OpenAI周三宣布，自2月份以来，其企业用户群激增了50%，付费企业客户已达300万，与此同时，这家AI公司推出了一系列全新的工作场所工具，旨在与微软的企业级AI产品展开直接竞争。这一里程碑是在推出几项新的面向企业的功能时公布的，凸显了OpenAI在可靠、安全的AI工具能够收取高价的企业市场中的积极扩张，该公司推出了新的“连接器”，这些连接器将ChatGPT与流行的商业应用程序集成在一起，还推出了一项名为“记录模式”(Record Mode)的会议转录功能，并对其深度研究(Deep Research)和Codex编码工具进行了增强。 “ChatGPT正在帮助企业转型，帮助员工更高效、更战略性地工作，”OpenAI的一位发言人告诉记者，“在过去的几个月里，我们一直在不断将ChatGPT发展成为一个对工作越来越有影响力的平台，提供了连接器、与ChatGPT集成的记录模式、Codex、图像生成、深度研究等商业产品。

6/6/2025 7:00:00 AM

Michael

资讯热榜

印度创新试点：AI 聊天机器人助力电子商务购物新方式两部门联合发布《政务领域人工智能大模型部署应用指引》大力推动AI技术应用 OpenAI新研究称GPT-5为迄今“政治偏见最少”的AI模型马斯克 xAI 在孟菲斯开建全球最大污水处理厂，年节约饮用水达 190 亿升软银贷款50亿美元助力AI投资，孙正义押注未来科技！前DeepMind大神创业一年估值飙至80亿美元：Reflection AI要做美国版DeepSeek Sora2公布提示词指南！直接抄作业能玩一整天！超越ZIP的无损压缩来了！华盛顿大学让大模型成为无损文本压缩器

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画数据机器人大模型 Midjourney 开源 Meta 智能微软用户 AI新词 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练论文代码 LLM 算法 Stable Diffusion 芯片腾讯 AI for Science 苹果 Claude Agent 蛋白质开发者生成式神经网络 xAI 机器学习 3D 研究人形机器人生成 AI视频百度工具 RAG 大语言模型 Sora 华为 GPU 计算具身智能 AI设计字节跳动搜索大型语言模型 AGI 场景深度学习视频生成架构预测视觉 DeepMind 伟达 Transformer 编程神器推荐 AI模型亚马逊 MCP

理论