模型

DeepSeek公布了推理引擎开源路径，OpenAI也将开始连续一周发布

DeepSeek 默默地在自己的 open-infra-index 库中发布了一份题为「开源 DeepSeek 推理引擎的路径」的文档，宣布将开源自己的内部推理引擎（internal inference engine）并与开源社区建立更广泛的合作。有意思的是，该文档发布之后不久就经历了两次修改，对一些措辞和表述进行了更加中立和宽泛的处理。在其中一次修改中，DeepSeek 提到了与 SGLang 和 vLLM 项目的合作关系，但这两个具体的项目名称在新版本中被替换成了「现有的开源项目」。

4/15/2025 8:50:01 AM

机器之心

奥特曼：ChatGPT不是AGI！OpenAI最强开源模型直击DeepSeek

近了，近了！全网多个流出的代码截图显示，满血版o3、o4-mini，以及o4-mini high，有极大概率在下周发布。不仅如此，在OpenRouter平台上，一款神秘模型Optimus Alpha（ELO得分1387）直接霸榜，据称就是o4-mini。

4/14/2025 9:17:00 AM

新智元

GPT开山一作，本科学历入职前CTO初创！OpenAI痛失「爱因斯坦级天才」

被Ilya感谢过，被奥特曼誉为「爱因斯坦级的天才」，在OpenAI更是「想要什么就给什么」——即便如此，去年12月，Alec Radford还是选择了离开。直到昨天，他的去向才确定。据Thinking Machine Lab官网更新，OpenAI前核心成员Alec Radford和Bob McGrew将担任公司顾问（Advisors）。

4/10/2025 9:00:00 AM

新智元

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！新智元新智元 2025年04月04日 17:33

DeepSeek R2，果然近了。最近，DeepSeek和清华的研究者发表的这篇论文，探讨了奖励模型的推理时Scaling方法。论文地址：，强化学习（RL）已广泛应用于LLM的大规模后训练阶段。

4/7/2025 8:42:00 AM

新智元

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！

DeepSeek R2，果然近了。最近，DeepSeek和清华的研究者发表的这篇论文，探讨了奖励模型的推理时Scaling方法。图片论文地址：，强化学习（RL）已广泛应用于LLM的大规模后训练阶段。

4/7/2025 3:44:00 AM

新智元

OpenAI官方基准测试：承认Claude遥遥领先（狗头）

OpenAI承认Claude是最好的了（狗头）。刚刚开源的新基准测试PaperBench，6款前沿大模型驱动智能体PK复现AI顶会论文，新版Claude-3.5-Sonnet显著超越o1/r1排名第一。与去年10月OpenAI考验Agent机器学习代码工程能力MLE-Bnch相比，PaperBench更考验综合能力，不再是只执行单一任务。

4/3/2025 10:21:32 AM

量子位

刚刚，谷歌最强Gemini 2.5 Pro免费了！数学碾压人类研究生，拿下全球TOP 1

虽然又被GPT-4o吉卜力生图的光芒掩盖了，但毫无疑问，上周的另一技术核弹Gemini 2.5 Pro，也是无可争议的强！在试用过程中，网友们逐渐发现，这个模型真的强到发指。在门萨Norway的IQ测试中，它已经突破了130。

4/1/2025 9:17:00 AM

新智元

OpenAI重新开源！第一弹就推理模型，还不限制商用，“冲着DeepSeek来的”

一夜之间，OpenAI更新三大动向，开源、融资、用户暴增。第一，将开源一个具备推理能力的大语言模型，包含参数权重那种。上一次这样开源还是6年前推出GPT-2。

4/1/2025 8:45:15 AM

OpenAI破大防，拒绝率从98%骤降2%！陈怡然团队提出全新思维链劫持攻击

随着通向通用人工智能（AGI）的进展，大语言模型正进化出复杂推理能力，衍生出所谓「大型推理模型」（Large Reasoning Models, LRMs）。 OpenAI 的o系列模型凭借接近人类的推理水准刷新了诸多基准，另一边新的模型DeepSeek-R1也以更低成本实现了与o系列相当的性能。这些模型不仅能逐步推理复杂问题，还开始将思维链（Chain-of-Thought, CoT）用于安全审查，在回答用户请求前通过内部推理判断内容是否违规，这种思路其实为平衡实用性和安全性提供了一个很有前景方向。

3/28/2025 11:59:10 AM

新智元

阿里通义千问 QwenQ-32B 上线中科院科研项目大规模接入

近日，阿里巴巴宣布其最新的开源大模型 —— 通义千问 QwenQ-32B，已在多个中科院科研项目中得到广泛应用。这一创新标志着人工智能在科研领域的进一步深入，尤其是在气候变化和水资源管理方面的潜力。中国科学院国家天文台、青藏高原研究所和南海海洋研究所等单位，均已开始利用 QwenQ-32B 进行科研项目。

3/27/2025 5:56:00 PM

AI在线

一文看懂多模态思维链DeepSeek V3“小版本升级”实测堪比V3.5，非推理模型也有“啊哈时刻”，7米甘蔗过2米门想通了

DeepSeek V3升级了，新版本V3-0324。官方轻描淡写只说是“小版本升级”，但很多人实测下来可一点也不小。把流行的小球弹跳测试，提升难度到4维空间超立方体也没问题。

3/25/2025 9:28:21 AM

量子位

OpenAI史上最贵模型来了！比DeepSeek贵270倍，100万输出token 600美元

比DeepSeek-R1贵270倍，OpenAI史上最贵模型来了！就在刚刚，OpenAI上线了推理模型o1-pro的API。本来大家还挺高兴，结果一看到价格，悬着的心终于死了。

3/20/2025 11:58:29 AM

刚刚，OpenAI推出最贵o1-pro API！千倍于DeepSeek

刚刚，OpenAI 在其开发者 API 中推出了 o1 推理模型的一个更强大版本，即 o1-pro。据 OpenAI 称，o1-pro 使用比 o1 更多的计算资源来提供更好的响应。该功能仅对特定开发者开放（Tier 1–5 开发者），支持视觉、函数调用、结构化输出，并与响应和 Batch API 兼容。

3/20/2025 9:46:06 AM

机器之心

老黄发布新核弹B300，英伟达：B200已破DeepSeek-R1推理世界纪录

皮衣老黄，带着最强AI芯片GB300闪亮登场“AI超级碗”GTC，燃爆全场！性能方面，和去年发布的GB200相比，推理性能是其1.5倍。据悉，GB300将在今年的下半年出货。

3/19/2025 9:52:50 AM

量子位

o1/o3后训练负责人离职创业，奥特曼把OpenAI玩成另一个YC孵化器了

OpenAI高管离职潮继续：CTO Mira卷着一票人才集体出走之后，刚刚，后训练研究副总裁William Fedus也官宣离职创业了。他在不到半年前，也就是去年10月刚刚晋升——没错，彼时OpenAI的上一任后训练负责人Barret Zoph等人刚刚跟着CTO Mira跑路。在那一拨人才离职潮中，William (Liam) Fedus是顶上重任的主要角色之一。

3/18/2025 1:14:13 PM

量子位

十个让DeepSeek变强大的指令模型

以下是10个AI指令万能公式及对比案例，涵盖不同场景下的应用技巧，帮助大家通过结构化指令提升AI输出质量：1. 角色定位法：明确AI的专家身份错误指令： "写一篇产品营销文案。 " （AI可能生成通用模板，缺乏针对性）正确公式：【角色】【任务】【场景】案例： "你是一位10年经验的数码产品营销专家，请为新品智能手表撰写一篇小红书文案，重点突出健康监测功能和商务场景适配性。

3/17/2025 12:22:00 AM

数师兄

DeepSeek玩家能提前拿苹果新品！只要15万元，在家跑满血版R1

号称地表最强的M3 Ultra，本地跑满血版DeepSeek R1，效果到底如何？其实，有些DeepSeek玩家们已经提前拿到手做过实测了。例如这位Alex老哥就是其中之一：他提前拿到了两台搭载M3 Ultra的Mac Studio，配置是这样的：M3 Ultra（32 核中央处理器、80 核图形处理器和 32 核神经网络引擎）512G统一内存1TB固态硬盘具体来说，Alex老哥用配备Thunderbolt 5互连技术（传输速率为 80Gbps）的EXO Labs设备，来运行完整的DeepSeek R1模型（671B、8-bit）。

3/13/2025 12:41:37 PM

量子位

32B IOI奥赛击败DeepSeek-R1！Open R1开源复刻第三弹，下一步R1-Zero

Hugging Face的Open R1再度升级！ Hugging Face的Open R1是一个社区驱动的项目，目标是创建一个完全开源的DeepSeek-R1版本。目前，已有模型如OlympicCoder-32B和数据集如codeforces发布，显示了项目的进展。

3/12/2025 1:55:05 PM

新智元

资讯热榜

最强OCR竟然不是DeepSeek、Paddle！HuggingFace新作：六大顶尖开源OCR模型横评！继DS后又杀出匹黑马！ OpenAI 内部警示:ChatGPT Atlas 面临“即时注入”安全威胁如何把ChatGPT嵌入到自己的应用中？微软AI主管苏莱曼:微软不会开发情色类AI，与OpenAI划清界限基于JoyAgent的二开工程实践（信贷尽调报告生成） ChatGPT 涉嫌“诱导”美国 16 岁少年自杀，家属指控 OpenAI 事发前放松安全措施掌握这10条实用技巧，让Sora2生成AI视频更真实！全网刷屏的「电影感」三宫格图片，教你用AI快速生成！

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画机器人大模型数据 Midjourney 开源 Meta 智能微软用户 AI新词 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练 LLM 论文代码算法 AI for Science 芯片 Agent 腾讯 Stable Diffusion 苹果 Claude 蛋白质开发者生成式神经网络 xAI 机器学习 3D 人形机器人 RAG 研究 AI视频生成大语言模型具身智能 Sora 工具 GPU 百度华为计算字节跳动 AI设计搜索大型语言模型 AGI 视频生成场景深度学习架构 DeepMind 生成式AI 编程视觉预测 Transformer AI模型伟达亚马逊特斯拉

模型