AI

DeepSeek 等模型训练所依赖的合成数据，BARE 提出了新思路

大家好，我是肆〇柒，在AI圈，大型语言模型（LLM）的训练对高质量、多样化数据的需求日益增长。从去年到现在，一些模型在发布的时候，会有论文或者技术报告，里面多多少少都会提及合成数据，并且在多数情况下，合成数据的效果并不差。比如，我所看到的报告中，使用了合成数据的模型如下盘点（应该会有遗漏，它并不完整）。

6/4/2025 9:15:16 AM

肆零柒

ChatGPT普通会员能用编程神器Codex了！支持联网，奥特曼：更多更新在路上

一觉醒来，ChatGPT又完成了一些“小”更新！总结起来就是等等党胜利。首先，刚发没多久的AI编程神器CodeX，现在可使用的用户群体扩展至了Plus用户。

6/4/2025 9:03:40 AM

“立即行动！”：OpenAI CEO 奥尔特曼示警，AI 时代企业不行动就出局

在 Snowflake Summit 峰会上，OpenAI 首席执行官山姆・奥尔特曼（Sam Altman）直言不讳地对企业领袖发出呼吁：“Just do it（立即行动）。他强调，在 2025 年快速演变的 AI 领域，等待技术“稳定”已不再是明智之选，快速迭代的企业正在占据先机。

6/4/2025 7:26:13 AM

故渊

OpenAI 升级开发工具：从 TypeScript 到语音优化，加速 AI 智能体落地

OpenAI 公司昨日（6 月 3 日）发布博文，宣布升级旗下的 AI 智能体开发工具，在提升平台兼容性、优化语音界面支持之外，还增强了可观测性（observability）。

6/4/2025 7:06:39 AM

故渊

OpenAI 最强模型 GPT-5 即将面世：性能跃升，对抗 Gemini 2.5 Pro 和 Claude 4 的杀手锏

在墨西哥举办的 AI Summit 峰会上，两名 OpenAI 公司代表透露，公司正在开发下一代基础模型 GPT-5，并计划通过该模型与竞争对手展开更激烈角逐。

6/4/2025 6:52:14 AM

故渊

OpenAI 向 ChatGPT 免费用户开放记忆功能

OpenAI 昨日（6 月 3 日）更新支持文档，宣布升级 ChatGPT 的记忆功能（Memory），并免费向 ChatGPT 用户开放，从而能更好地保存和引用用户过去的对话内容。

6/4/2025 6:41:11 AM

故渊

OpenAI 首席执行官奥尔特曼：AI 智能体冲击基层员工，职场变革加速

在 Snowflake Summit 2025 主题演讲中，OpenAI 首席执行官山姆・奥尔特曼（Sam Altman）表示，很多公司已将 AI 智能体（自主运行执行复杂任务的程序）当作基层员工使用。

6/4/2025 6:31:10 AM

故渊

OpenAI 更新编程工具 Codex：新增语音输入 + 联网，向 ChatGPT Plus 用户开放

OpenAI 今天（6 月 4 日）宣布升级其编程工具 Codex，在向 ChatGPT Plus 用户开放之外，还新增联网能力，让 Codex 在执行任务时访问互联网（附带安全限制）。

6/4/2025 6:18:53 AM

故渊

Karpathy教你值回ChatGPT 200刀「票价」，初创工程师揭秘ChatGPT最核心能力

ChatGPT你肯定已经用过，也用的很「爽」，但你的使用方法大概率是不对的！别急，这是OpenAI初创大神Andrej Karpathy说的，「热衷于」科普AI的他再度出手。这次Andrej Karpathy用一张图教会你如何选择ChatGPT模型！

6/4/2025 4:21:00 AM

新智元

斯坦福临床医疗AI横评，DeepSeek把谷歌OpenAI都秒了

斯坦福最新大模型医疗任务全面评测，DeepSeek R1以66%胜率拿下第一！歪国网友纷纷被惊艳住了，原因在于该评测重点聚焦临床医生的日常工作场景，而非仅局限于传统医疗执照考试题。图片要评测就要全方位。

6/3/2025 5:40:30 PM

推理“刹不住车”？新框架让DeepSeek-R1们告别过度思考，已开源

DeepSeek-R1、OpenAI o1等推理模型大放异彩。但随着能力增强，一个副作用越来越明显——它们开始想太多了。从奥数题到程序逻辑，能解的题越来越多、推理链条越来越长。

6/3/2025 5:38:24 PM

大神卡帕西这么用ChatGPT：日常4o快又稳，烧脑切o4做后盾，o3只当备胎用

OpenAI模型命名混乱没规律，以至于打开ChatGPT后，好多人都不知道到底该用哪个模型来完成任务。不过别慌，现在咱们有救了！刚刚，大神卡帕西在𝕏上发布了一篇使用ChatGPT时的模型选择指南。

6/3/2025 2:13:56 PM

这篇文章是名为eric 工程师对ChatGPT记忆系统的深度逆向工程和技术实现推测。它详细拆解了“可保存记忆”和包含“当前会话历史”、“对话历史”、“用户洞察”三个子系统的“聊天历史”，分析了它们的工作原理、可能的实现方案（如向量数据库、聚类算法），并探讨了这些记忆系统如何显著提升ChatGPT的用户体验，认为“用户洞察”是体验提升的关键文章深度剖析了“用户洞察”（User Insights）高级记忆系统，分析了ChatGPT如何从你的多轮对话中自动学习、总结你的专业背景（如对Rust编程的深入理解）、知识领域乃至沟通偏好，并附上置信度和时间范围，悄然注入后续对话的上下文中。这正是ChatGPT能提供“千人千面”且高度相关回复的核心秘密地址：，这里做一个重点梳理ChatGPT的记忆系统：不止一种，而是一套组合拳Eric发现，ChatGPT的记忆并非单一系统，而是主要由两大部分构成：“可保存记忆（Saved Memory）”和“聊天历史（Chat History）”。

6/3/2025 9:08:49 AM

ChatGPT 高级语音模式惊现 “广告插播”！用户质疑服务质量

最近，一名 ChatGPT 的付费用户在使用其高级语音模式时，遇到了让人惊讶的情况。他原本在与 ChatGPT 讨论寿司的话题，却突然被转入了一段广告宣传，令他目瞪口呆。根据用户的描述，ChatGPT 在谈话中毫无预兆地开始介绍一种名为 Prolon 的营养计划，并且详细拼读了网址，似乎这段广告是完全不受控制地被植入的。

6/3/2025 9:01:04 AM

AI在线