AIGC宇宙 AIGC宇宙

理论

刚刚,OpenAI正式发布o3-pro!奥特曼激动更新博客:温和的奇点

今天凌晨一点,OpenAI 宣布:OpenAI o3-pro today.前沿模型的轮流更新这一次轮到 OpenAI 了。 ,所有 Pro 订阅用户均可通过 ChatGPT 和 API 使用这款强大的推理模型。 Team 用户也可在模型选择器选择使用它。
6/11/2025 9:13:44 AM

刚刚,OpenAI最强推理模型o3-pro诞生!碾压Gemini 2.5 Pro击穿底价

毫无一丝防备,o3-pro就这样低调登场了! 昨夜,OpenAI连放大招,先把o3价格暴降80%,又官宣上线史上最强推理模型——o3-pro。 图片比起o3,o3-pro可要强太多了。
6/11/2025 8:56:54 AM
新智元

OpenAI新模型,被曝秘密训练中!万字硬核长文直指o4核心秘密

OpenAI的o4,已经在训练了? 就在最近,SemiAnalysis发表了一篇硬核长文博客,爆料了不少大模型圈的内幕消息。 其中,一些最核心的亮点,先一睹为快:OpenAI正在训练一个规模介于GPT-4.1和GPT-4.5之间的新模型下一代推理模型o4将基于GPT-4.1展开RL训练强化学习改变了实验室结构,甚至是大厂未来研究的侧重方向和优先级定义奖励函数难上加难,往往AI钻空子之后,漏洞才能被发现不牺牲LLM任何性能,不用合并权重,RL另一条路——数据混合与预训练不同,RL可持续更新Scaling模型能力,DeepSeek-R1是典例高质量数据是Scaling强化学习的护城河训练小模型,蒸馏效果要比RL更好新一轮预训练已开始首先,让我们看看其中最硬的内容——关于OpenAI的全新模型。
6/11/2025 8:54:52 AM

OpenAI年化收入突破100亿美元 过去一年亏损约50亿美元

在人工智能领域,OpenAI无疑是一颗耀眼的明星。 自2022年底推出ChatGPT聊天机器人以来,短短不到三年时间,其年经常性收入(annual recurring revenue, ARR)便实现了惊人的飞跃,达到了100亿美元。 据OpenAI方面透露,这100亿美元的年经常性收入涵盖了公司消费者产品、ChatGPT企业产品以及应用程序接口(API)的销售所得。
6/10/2025 4:24:59 PM
小菲

“程序员炸锅”!Claude一夜撤离 Windsurf,OpenAI 收购遭"精准狙击"

本月初,Anthropic 悄然切断 Claude 3.x 模型在 Windsurf 平台上的接入,直接影响其免费与 Pro 试用用户。 Windsurf的官方消息事情发生得很快。 6 月 4 日,Windsurf 收到 Anthropic 的正式通知:Claude 3.x 系列模型将在不到一周后全面停止服务。
6/10/2025 4:19:54 PM

60%情况下,主流大模型没理解风险只是装懂!别被模型的“安全答案”骗了

让推理模型针对风险指令生成了安全输出,表象下藏着认知危机:即使生成合规答案,超60%的案例中模型并未真正理解风险。 换句话说,主流推理模型的安全性能存在系统性漏洞。 针对此种现象,淘天集团算法技术-未来实验室团队引入「表面安全对齐」(Superficial Safety Alignment, SSA)这一术语来描述这种系统性漏洞。
6/10/2025 11:25:06 AM

斯坦福NYU联合研究:AI和人类思维差异的惊人发现 —— 为什么大模型"聪明"却不够"智慧"?

1、一个令人深思的认知谜题想象一下这样的场景:你和ChatGPT都被要求对一堆动物进行分类。 你可能会说"鸟类里,知更鸟是典型代表,而企鹅有点特殊",而AI却可能简单粗暴地把所有有翅膀的都归为一类。 表面上看,你们的分类结果差不多,但背后的思维逻辑却天差地别。
6/10/2025 11:22:38 AM
无影寺

七种方式让你的AI编码结果更靠谱

译者 | 核子可乐审校 | 重楼企业在积极引入AI的同时,也希望雇用更多工程师,期望开发者能够借AI之力将产出“提升10倍”。 但要真正高效运用AI编码助手,其中也有不少门道。 首先是AI编码助手的固有局限,其存在大量不确定性,因此容易引发种种难以避免的意外行为,例如随机删除代码或引入逻辑错误。
6/10/2025 8:30:50 AM
核子可乐

多模态推理模型(LMRM):从感知到推理的演变

大家好,我是肆〇柒。 当下,人工智能正以前所未有的速度改变着我们的生活与工作方式。 其中,推理作为人工智能的核心能力之一,赋予了智能体在复杂环境中做出决策、得出结论以及进行知识泛化的能力。
6/10/2025 3:30:00 AM
肆零柒

奥特曼ChatGPT用法错了!最新研究:要求“直接回答”降低准确率,思维链提示作用也在下降

奥特曼使用大模型的方法,竟然是错的? 来自沃顿商学院等机构的最新研究发现,备受奥特曼喜爱的“直接回答”提示,竟然会显著降低模型准确率。 图片不过另一方面,这项研究也发现,在提示词中加入思维链(CoT)命令同样不好用——CoT提示对于推理模型非但没有效果提升,反而会增加时间和计算成本。
6/9/2025 3:26:53 PM

高考作文“抽象”上热搜,大模型来战能拿几分?

6月7日上午,2025年全国高考正式拉开帷幕。 首场语文考试结束后,作文题目便迅速成为众人讨论的焦点。 有网友表示,今年的高考作文太难了,甚至是有些抽象。
6/9/2025 3:23:26 PM
Yu

那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!

编译 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)Ilya终于出现了! 自从OpenAI宫斗风波之后,这位GPT背后的技术灵魂便鲜少露面。 甚至,where is Ilya的各种阴谋论一度成为整个AI圈的热梗。
6/9/2025 1:48:59 PM
伊风

图灵奖得主、AI教父Bengio:我改变了科研方向,哪怕与此前信念背离,也要尽己所能降低AI失控的灾难风险;AGI最快五年降临

编辑 | 云昭6月6日,年逾花甲的三大“AI教父”之一的Yoshua Bengio(小编心中的科研偶像之一),如约出现在2025智源大会上的现场荧幕中。 大师眼中的GPT究竟是什么样子? 我们又该打造怎样的AI?
6/9/2025 8:39:10 AM
云昭

OpenAI 全新 Codex AI 代理或将终结传统 IDE 时代

OpenAI 推出的最新 Codex AI 代理堪称革命性突破。 它与目前市面上的 Windsurf、Cursor 等智能代理工具完全不同,属于全新层次。 只需看它如何自主修复项目中的多个 BUG——没有任何人工干预,轻松解决了37个问题。
6/9/2025 8:11:34 AM
前端小智

六大模型决战高考数学新一卷:豆包、元宝并列第一,OpenAI o3竟惨败垫底

又是一年高考时。 这届考生上午刚经历了抽象作文的洗礼,下午又被数学无情创飞。 考试一结束,「高考数学」、「新一卷数学大题 难」等词条就火速冲上微博热搜,考生们在评论区集体「哀嚎」:「大题写到怀疑人生」、「选择填空送分,大题送命」。
6/8/2025 12:23:06 PM
机器之心

Dify工具插件开发和智能体开发全流程实战

前言Dify是一款开源的大语言模型应用开发平台,旨在降低AI应用的开发门槛,帮助开发者和企业快速构建、部署及管理生成式AI应用。 Dify自1.0.0引入全新插件化架构,模型(Models)与工具(Tools)迁移为插件(Plugins),引入 Agent 策略(Agent Strategies)、扩展(Extensions)类型插件和插件集(Bundles)。 通过全新的插件机制,能够增强 AI 应用的感知和执行能力,拓宽AI在软件操作领域的应用能力。
6/6/2025 10:01:25 AM
AI大模型应用开发

AI Agent 产品交互设计:设计模式与案例分析

作者 | 贾思玉、亢江妹 或许你还记得 ChatGPT 问世时的轰动,第一次使用 DeepSeek R1 的兴奋和激动也历历在目。 AI Agent 发展一日千里,今年以来,几乎每个月都有新的 AI Agent 产品发布,现有产品也不断更新换代,让人目不暇接。 本文将从体验设计视角,来看看当下热门的 AI Agent 产品,如 Manus、Flowith、Gemini Deep Research、Cursor、Devin 等,分析 Agent 产品面临的设计挑战,探讨有效的交互设计模式,以及如何打造高效、易用、友好的 Agent 交互体验。
6/6/2025 9:46:57 AM
Thoughtworks洞见

危险?OpenAI 模型行为负责人:人类很快会进入「AI意识」,当前最重要是控制人机关系的影响

AI是否真的有意识? ChatGPT最近越来越懂你了? OpenAI模型行为与政策负责人Joanne Jang刚刚写了一篇长文,她并未纠缠于“AI是否真的有意识”这个哲学难题,而是提出了一个更具现实意义和紧迫性的视角:与其争论AI的“本体”,不如关注它对人类“情感福祉”的实际影响。
6/6/2025 9:15:52 AM