模型

Muon作者仅用一篇博客，就被OpenAI看中了

「许多博士（包括过去的我）都陷入了这样一个误区：认为只有在顶级会议上发表论文才是终极目标。」AI 云服务商 Hyperbolic CEO Yuchen Jin 如是说。但现在，发表论文并不与学术影响力直接画等号了。

6/16/2025 2:43:38 PM

GPT-4o宁让人类陷入危险，也不愿被关闭！OpenAI前高管敲响警钟

前OpenAI高管Steven Adler的最新研究敲响警钟，AI有时会为了避免被关闭，采取令人不安的手段，比如敲诈。基于在OpenAI的经验，Steven开始思考一个严重的问题：ChatGPT会不会为了「自保」而置用户于危险？最新研究发现，在模拟测试中，ChatGPT有时会优先考虑自身的生存，而不是保护用户的安全。

6/12/2025 2:26:01 PM

刚刚，OpenAI正式发布o3-pro！奥特曼激动更新博客：温和的奇点

今天凌晨一点，OpenAI 宣布：OpenAI o3-pro today.前沿模型的轮流更新这一次轮到 OpenAI 了。，所有 Pro 订阅用户均可通过 ChatGPT 和 API 使用这款强大的推理模型。 Team 用户也可在模型选择器选择使用它。

6/11/2025 9:13:44 AM

OpenAI新模型，被曝秘密训练中！万字硬核长文直指o4核心秘密

OpenAI的o4，已经在训练了？就在最近，SemiAnalysis发表了一篇硬核长文博客，爆料了不少大模型圈的内幕消息。其中，一些最核心的亮点，先一睹为快：OpenAI正在训练一个规模介于GPT-4.1和GPT-4.5之间的新模型下一代推理模型o4将基于GPT-4.1展开RL训练强化学习改变了实验室结构，甚至是大厂未来研究的侧重方向和优先级定义奖励函数难上加难，往往AI钻空子之后，漏洞才能被发现不牺牲LLM任何性能，不用合并权重，RL另一条路——数据混合与预训练不同，RL可持续更新Scaling模型能力，DeepSeek-R1是典例高质量数据是Scaling强化学习的护城河训练小模型，蒸馏效果要比RL更好新一轮预训练已开始首先，让我们看看其中最硬的内容——关于OpenAI的全新模型。

6/11/2025 8:54:52 AM

危险？OpenAI 模型行为负责人：人类很快会进入「AI意识」，当前最重要是控制人机关系的影响

AI是否真的有意识？ ChatGPT最近越来越懂你了？ OpenAI模型行为与政策负责人Joanne Jang刚刚写了一篇长文，她并未纠缠于“AI是否真的有意识”这个哲学难题，而是提出了一个更具现实意义和紧迫性的视角：与其争论AI的“本体”，不如关注它对人类“情感福祉”的实际影响。

6/6/2025 9:15:52 AM

OpenAI久违发了篇「正经」论文：线性布局实现高效张量计算

OpenAI 发论文的频率是越来越低了。如果你看到了一份来自 OpenAI 的新 PDF 文件，那多半也是新模型的系统卡或相关增补文件或基准测试，很少有新的研究论文。至于原因嘛，让该公司自家的 ChatGPT 来说吧：「截至目前，OpenAI 在 2025 年在 arXiv 上公开发布的论文数量相对较少，可能反映了其对研究成果公开策略的谨慎态度，可能出于商业保密或安全考虑。

6/5/2025 11:49:59 AM

OpenAI深夜宣布ChatGPT支持MCP、会议记录，万物互联时代来了！

今天凌晨1点，OpenAI开始技术直播对ChatGPT进行了重大更新，包括向macOS用户推出ChatGPT会议记录模式，可以转录任何会议、头脑风暴或语音笔记，并快速提取要点然后转化为新的内容。另外一个重要功能就是ChatGPT正式支持MCP协议，例如，直接连接Github、SharePoint、Gmail、Dropbox、Box、Outlook等常用工具，实现跨平台数据整合、搜索和推理。简单来说，OpenAI希望把ChatGPT打造成智能协作平台，在一个地方就把所有事情都做了。

6/5/2025 9:21:10 AM

GPT-5七月上线？内部爆料+奥特曼疯狂暗示，自曝前方时刻「令人恐惧」

GPT-5，真要来了？最近，关于GPT-5发布时间的消息，闹得是满城风雨。多项信息来源显示，GPT-5上线的时间，就在今年7月！

6/4/2025 9:06:00 AM

Karpathy教你值回ChatGPT 200刀「票价」，初创工程师揭秘ChatGPT最核心能力

ChatGPT你肯定已经用过，也用的很「爽」，但你的使用方法大概率是不对的！别急，这是OpenAI初创大神Andrej Karpathy说的，「热衷于」科普AI的他再度出手。这次Andrej Karpathy用一张图教会你如何选择ChatGPT模型！

6/4/2025 4:21:00 AM

新智元

推理“刹不住车”？新框架让DeepSeek-R1们告别过度思考，已开源

DeepSeek-R1、OpenAI o1等推理模型大放异彩。但随着能力增强，一个副作用越来越明显——它们开始想太多了。从奥数题到程序逻辑，能解的题越来越多、推理链条越来越长。

6/3/2025 5:38:24 PM

大神卡帕西这么用ChatGPT：日常4o快又稳，烧脑切o4做后盾，o3只当备胎用

OpenAI模型命名混乱没规律，以至于打开ChatGPT后，好多人都不知道到底该用哪个模型来完成任务。不过别慌，现在咱们有救了！刚刚，大神卡帕西在𝕏上发布了一篇使用ChatGPT时的模型选择指南。

6/3/2025 2:13:56 PM

逆向工程：ChatGPT 的记忆是如何工作的

这篇文章是名为eric 工程师对ChatGPT记忆系统的深度逆向工程和技术实现推测。它详细拆解了“可保存记忆”和包含“当前会话历史”、“对话历史”、“用户洞察”三个子系统的“聊天历史”，分析了它们的工作原理、可能的实现方案（如向量数据库、聚类算法），并探讨了这些记忆系统如何显著提升ChatGPT的用户体验，认为“用户洞察”是体验提升的关键文章深度剖析了“用户洞察”（User Insights）高级记忆系统，分析了ChatGPT如何从你的多轮对话中自动学习、总结你的专业背景（如对Rust编程的深入理解）、知识领域乃至沟通偏好，并附上置信度和时间范围，悄然注入后续对话的上下文中。这正是ChatGPT能提供“千人千面”且高度相关回复的核心秘密地址：，这里做一个重点梳理ChatGPT的记忆系统：不止一种，而是一套组合拳Eric发现，ChatGPT的记忆并非单一系统，而是主要由两大部分构成：“可保存记忆（Saved Memory）”和“聊天历史（Chat History）”。

6/3/2025 9:08:49 AM

o3崛起，但推理模型离「撞墙」只剩一年？

最多一年，推理模型就会撞上训练算力的「天花板」。 OpenAI的o3这样的推理模型，诞生还不到一年，能力已经突飞猛进。 OpenAI的研究人员非常乐观地认为，这种趋势会持续下去。

6/3/2025 8:26:00 AM

Anthropic重磅开源！“电路追踪”工具解锁AI大脑，揭秘大模型决策全过程

近年来，大语言模型（LLM）的快速发展为人工智能领域带来了前所未有的突破，但其内部决策过程却常常被视为“黑盒子”，难以捉摸。 5月29日，AI研究领域的明星公司Anthropic发布了一项重大开源成果——“电路追踪”(Circuit Tracing)工具，为破解大模型的内部工作机制提供了全新视角。这一工具不仅能帮助研究人员深入探索AI的“思考”过程，还为推动更透明、可控的AI发展迈出了重要一步。

5/30/2025 10:01:14 AM

AI在线