AIGC宇宙 AIGC宇宙

理论

奥特曼深夜「放鸽子」!不发GPT-5,竟是给7亿用户「防沉迷」?

昨晚ChatGPT带来了一个好消息和一个坏消息。 好消息是,ChatGPT的最新数据出炉! 这可能是地球上第一个如此之快达成周活7亿的APP,这意味着地球上每10个人中就有1个人使用ChatGPT。
8/5/2025 10:35:47 AM
新智元

奥特曼:ChatGPT只是意外,全能AI智能体才是真爱!Karpathy:7年前就想到了

历史往往都是由无数「意外和巧合」所塑造的。 2022年,当研究员Hunter Lightman加入OpenAI时,他的同事们正忙于引爆全球的ChatGPT——这无疑是史上用户增长最快的现象级产品。 然而,Lightman却悄悄投身于一个看似不起眼的团队:MathGen。
8/5/2025 9:08:00 AM

揭秘大模型的魔法:实现带可训练权重的自注意力机制

大家好,我是写代码的中年人。 上一篇我们实现了一个“无可训练参数”的注意力机制,让每个词都能“看看别人”,计算出自己的上下文理解。 虽然实现起来不难,但它只是个“玩具级”的注意力,离真正的大模型还差了几个“亿”个参数。
8/4/2025 9:31:49 AM
写代码的中年人

Qwen3杀入全球前三,中国技术正式挑战OpenAI霸权

说实话,看到Qwen3 2507版本跻身全球AI模型前三的消息时,我第一反应是有点不敢相信。 毕竟在这个被OpenAI、Anthropic主导的AI世界里,国产模型能达到这个高度,确实让人意外。 但数据不会撒谎。
8/4/2025 9:19:06 AM
阿丸笔记

OpenAI护城河被攻破!AI新王Anthropic爆赚45亿,拿下企业级LLM市场

GPT-5再不来,奥特曼正要熬夜头秃,无法入眠了! 刚刚,OpenAI最强劲敌Anthropic被曝年化收益已达45亿美元,晋级为史上增长最快的软件公司。 在LLM API赛道上,Anthropic成功登顶,而OpenAI在AI编程上更是落荒而逃,市场份额只有Anthropic一半!
8/1/2025 2:37:07 PM

马斯克、吴恩达青睐,黄仁勋批评,见证百度、OpenAI内部起落,Anthropic CEO自曝式采访:诞生四年,每年营收十倍增长

编译 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)进入7月底,巨头们迎来了新一轮的财报周,而创业公司们也迎来了新一轮的采访和融资周。 昨天,Anthropic 的创始人 Dario Amodei 接受了知名播客 The Big Technology 的采访,主持人 Alex Kantrowitz 事后自己走访了 Dario 的朋友、同事、竞争者二十余次,特别为这次含金量满满的采访写了一篇特稿:《 Anthropic CEO 成长之路》。 可以说是 Dario 的半篇自传了。
8/1/2025 1:24:06 PM
云昭

OpenAI的“阳谋”:ChatGPT不想再当你枪手了

在AI圈里混久了,我们都心照不宣一个事实:ChatGPT,这个星球上最强大的语言模型,在无数个深夜里,成了学生们最“贴心”的作业枪手和答案搬运工。 OpenAI对此当然心知肚明,与其被动地陷入“作弊与反作弊”的猫鼠游戏,他们选择掀翻桌子,直接重新定义游戏规则。 于是,ChatGPT Study Mode 登场了。
7/31/2025 4:07:01 PM
墨风如雪

全网疯传GPT-5泄露!首次统一GPT和o系列,编程实测demo抢先曝光,下周发布?

GPT-5这回是真的要来了。 现在,全网都在“偶遇”GPT-5。 不仅是ChatGPT上有踪迹:图片而且在MacOS应用的模型列表中也发现了GPT-5。
7/31/2025 4:04:23 PM

地球版ChatGPT爆诞!谷歌AI 64维压缩人类星球,10米级「上帝视角」秒开

刚刚,Alpha家族又上新了! 这一次,谷歌DeepMind帮人类打开了「上帝视角」——全新AlphaEarth Foundations正以惊人的细节绘制出整个地球。 图片它集成了PB级地球观测数据,可生成统一的数据表示。
7/31/2025 2:07:58 PM

刚刚,扎克伯克公开信:Meta不会开源全部模型

Meta 联合创始人兼首席执行官马克・扎克伯格从 OpenAI、谷歌和苹果等公司挖走了众多顶尖 AI 研究人员,并开出了数亿美元的薪酬,此举震惊了整个科技行业。 现在,他正在更多地分享他对超级智能的愿景。 在 Meta 财报电话会议召开前几个小时,扎克伯格一封公开信广为传播。
7/31/2025 9:31:52 AM
机器之心

让 Gemini CLI 跑在你的私有大模型上

前不久,Google 开源了 Gemini CLI 工具,它允许用户通过命令行与 Gemini AI 模型进行高效交互。 然而,在实际应用中,出于安全性和成本控制的考虑,很多场景更适合使用本地部署的大语言模型(LLM)。 因此,让 Gemini CLI 支持连接本地 LLM 就显得尤为重要。
7/31/2025 6:45:00 AM
Andflow

2025年ChatGPT编程神器指南:20个开发者必学提示!

我几乎每天都在写代码,ChatGPT现在已经是我工作流程的一部分,就像Git或VS Code一样。 但经过几个月的摸索,我发现了一个真相:ChatGPT的强大之处不在于你让它“修这段代码”或“写个Python函数”。 真正的秘诀在于你怎么问。
7/31/2025 2:11:00 AM
AI研究生

ChatGPT「学习模式」火爆上线,一大波教育AI连夜被端!24小时导师免费用

刚刚,OpenAI迎来一个全新功能更新,但不是GPT-5。 ChatGPT上线了一个新模式——Study and Learn(学习模式)! 使用这种模式,ChatGPT不仅仅提供答案,而是逐步引导解决问题。
7/31/2025 1:15:00 AM

逆天!旧Mac上能run千亿参数SOTA!效果惊人:一次生成游戏,0修改!本地大模型拐点来了!网友:别被大模型叙事带偏了(附指南)

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)起猛了,连老电脑都能跑智谱家新一代的 SOTA 模型了! 一篇来自技术人 Simon Willison(Python 知名 Web 框架 Django 的共同创始人)的实测文章,在 Hacker News 上引发热议:“我 2.5 年高龄的旧笔记本,现在不仅能在本地跑千亿参数模型,甚至还能用它写出一款完整的 JavaScript 太空入侵者游戏。 ”图片 这个模型,正是昨天新鲜出炉的 GLM-4.5 系列。
7/30/2025 2:11:55 PM
伊风

大模型中的嵌入向量

前面文章和小伙伴们聊了 Tokenizer,经过 Tokenizer 之后,自然语言变为 Token,那么大模型就可以直接训练 Token 了嘛? 还不行! 接下来还有一个词嵌入的环境,英文就是 Embedding,Embedding 实际上就是将 Token 转为张量,在有的场景下,Embedding 也指张量本身。
7/30/2025 4:15:00 AM
江南一点雨

只需一次指令微调,大模型变身全能专家天团,8B模型性能反超全微调基线 | ACL25 Oral

只需一次指令微调,即可让普通大模型变身“全能专家天团”? 改造位置自动定位专家协作动态平衡8B模型性能反超全微调基线1.6%,安全指标暴涨10%,推理内存直降30%! 图片当前预训练语言大模型(LLM)虽具备通用能力,但适应专业领域需高昂的指令微调成本;稀疏混合专家(SMoE)架构作为可扩展的性能-效率平衡框架,虽能提升推理效率并灵活扩展模型容量,但其从头训练消耗巨大资源,因此复用密集大模型参数的升级改造(LLM Upcycling)成为更具成本效益的替代方案。
7/29/2025 2:12:00 AM

百元级硬件流畅运行百亿参数大模型!上交&本智激活开源端侧原生大模型

AI的下一个战场,不在云端,而在你的口袋里。 iPhone、华为、三星、小米、OPPO等各大手机厂商几乎都在将大模型塞进手机,端侧AI已然成为兵家必争之地。 背后的逻辑清晰而坚定:最懂你的AI,必须能安全地访问你的个人数据——邮件、照片、日程,而这一切的前提,就是将计算留在本地,将隐私还给用户。
7/28/2025 9:06:00 AM

大模型“天梯赛”来了,让Agent在Kaggle真实任务中进化|佐治亚理工、斯坦福开源

当前最强大的大语言模型(LLM)虽然代码能力飞速发展,但在解决真实、复杂的机器学习工程(MLE)任务时,仍像是在进行一场“闭卷考试”。 它们可以在单次尝试中生成代码,却无法模拟人类工程师那样,在反复的实验、调试、反馈和优化中寻找最优解的真实工作流。 为了打破这一瓶颈,来自佐治亚理工学院和斯坦福大学的研究团队正式推出了 MLE-Dojo,一个专为训练和评测大模型智能体(LLM Agents)设计的“交互式武馆”。
7/28/2025 8:45:00 AM