理论
奥特曼深夜「放鸽子」!不发GPT-5,竟是给7亿用户「防沉迷」?
昨晚ChatGPT带来了一个好消息和一个坏消息。 好消息是,ChatGPT的最新数据出炉! 这可能是地球上第一个如此之快达成周活7亿的APP,这意味着地球上每10个人中就有1个人使用ChatGPT。
8/5/2025 10:35:47 AM
新智元
奥特曼:ChatGPT只是意外,全能AI智能体才是真爱!Karpathy:7年前就想到了
历史往往都是由无数「意外和巧合」所塑造的。 2022年,当研究员Hunter Lightman加入OpenAI时,他的同事们正忙于引爆全球的ChatGPT——这无疑是史上用户增长最快的现象级产品。 然而,Lightman却悄悄投身于一个看似不起眼的团队:MathGen。
8/5/2025 9:08:00 AM
揭秘大模型的魔法:实现带可训练权重的自注意力机制
大家好,我是写代码的中年人。 上一篇我们实现了一个“无可训练参数”的注意力机制,让每个词都能“看看别人”,计算出自己的上下文理解。 虽然实现起来不难,但它只是个“玩具级”的注意力,离真正的大模型还差了几个“亿”个参数。
8/4/2025 9:31:49 AM
写代码的中年人
Qwen3杀入全球前三,中国技术正式挑战OpenAI霸权
说实话,看到Qwen3 2507版本跻身全球AI模型前三的消息时,我第一反应是有点不敢相信。 毕竟在这个被OpenAI、Anthropic主导的AI世界里,国产模型能达到这个高度,确实让人意外。 但数据不会撒谎。
8/4/2025 9:19:06 AM
阿丸笔记
OpenAI护城河被攻破!AI新王Anthropic爆赚45亿,拿下企业级LLM市场
GPT-5再不来,奥特曼正要熬夜头秃,无法入眠了! 刚刚,OpenAI最强劲敌Anthropic被曝年化收益已达45亿美元,晋级为史上增长最快的软件公司。 在LLM API赛道上,Anthropic成功登顶,而OpenAI在AI编程上更是落荒而逃,市场份额只有Anthropic一半!
8/1/2025 2:37:07 PM
马斯克、吴恩达青睐,黄仁勋批评,见证百度、OpenAI内部起落,Anthropic CEO自曝式采访:诞生四年,每年营收十倍增长
编译 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)进入7月底,巨头们迎来了新一轮的财报周,而创业公司们也迎来了新一轮的采访和融资周。 昨天,Anthropic 的创始人 Dario Amodei 接受了知名播客 The Big Technology 的采访,主持人 Alex Kantrowitz 事后自己走访了 Dario 的朋友、同事、竞争者二十余次,特别为这次含金量满满的采访写了一篇特稿:《 Anthropic CEO 成长之路》。 可以说是 Dario 的半篇自传了。
8/1/2025 1:24:06 PM
云昭
OpenAI的“阳谋”:ChatGPT不想再当你枪手了
在AI圈里混久了,我们都心照不宣一个事实:ChatGPT,这个星球上最强大的语言模型,在无数个深夜里,成了学生们最“贴心”的作业枪手和答案搬运工。 OpenAI对此当然心知肚明,与其被动地陷入“作弊与反作弊”的猫鼠游戏,他们选择掀翻桌子,直接重新定义游戏规则。 于是,ChatGPT Study Mode 登场了。
7/31/2025 4:07:01 PM
墨风如雪
全网疯传GPT-5泄露!首次统一GPT和o系列,编程实测demo抢先曝光,下周发布?
GPT-5这回是真的要来了。 现在,全网都在“偶遇”GPT-5。 不仅是ChatGPT上有踪迹:图片而且在MacOS应用的模型列表中也发现了GPT-5。
7/31/2025 4:04:23 PM
地球版ChatGPT爆诞!谷歌AI 64维压缩人类星球,10米级「上帝视角」秒开
刚刚,Alpha家族又上新了! 这一次,谷歌DeepMind帮人类打开了「上帝视角」——全新AlphaEarth Foundations正以惊人的细节绘制出整个地球。 图片它集成了PB级地球观测数据,可生成统一的数据表示。
7/31/2025 2:07:58 PM
刚刚,扎克伯克公开信:Meta不会开源全部模型
Meta 联合创始人兼首席执行官马克・扎克伯格从 OpenAI、谷歌和苹果等公司挖走了众多顶尖 AI 研究人员,并开出了数亿美元的薪酬,此举震惊了整个科技行业。 现在,他正在更多地分享他对超级智能的愿景。 在 Meta 财报电话会议召开前几个小时,扎克伯格一封公开信广为传播。
7/31/2025 9:31:52 AM
机器之心
让 Gemini CLI 跑在你的私有大模型上
前不久,Google 开源了 Gemini CLI 工具,它允许用户通过命令行与 Gemini AI 模型进行高效交互。 然而,在实际应用中,出于安全性和成本控制的考虑,很多场景更适合使用本地部署的大语言模型(LLM)。 因此,让 Gemini CLI 支持连接本地 LLM 就显得尤为重要。
7/31/2025 6:45:00 AM
Andflow
2025年ChatGPT编程神器指南:20个开发者必学提示!
我几乎每天都在写代码,ChatGPT现在已经是我工作流程的一部分,就像Git或VS Code一样。 但经过几个月的摸索,我发现了一个真相:ChatGPT的强大之处不在于你让它“修这段代码”或“写个Python函数”。 真正的秘诀在于你怎么问。
7/31/2025 2:11:00 AM
AI研究生
ChatGPT「学习模式」火爆上线,一大波教育AI连夜被端!24小时导师免费用
刚刚,OpenAI迎来一个全新功能更新,但不是GPT-5。 ChatGPT上线了一个新模式——Study and Learn(学习模式)! 使用这种模式,ChatGPT不仅仅提供答案,而是逐步引导解决问题。
7/31/2025 1:15:00 AM
逆天!旧Mac上能run千亿参数SOTA!效果惊人:一次生成游戏,0修改!本地大模型拐点来了!网友:别被大模型叙事带偏了(附指南)
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)起猛了,连老电脑都能跑智谱家新一代的 SOTA 模型了! 一篇来自技术人 Simon Willison(Python 知名 Web 框架 Django 的共同创始人)的实测文章,在 Hacker News 上引发热议:“我 2.5 年高龄的旧笔记本,现在不仅能在本地跑千亿参数模型,甚至还能用它写出一款完整的 JavaScript 太空入侵者游戏。 ”图片 这个模型,正是昨天新鲜出炉的 GLM-4.5 系列。
7/30/2025 2:11:55 PM
伊风
大模型中的嵌入向量
前面文章和小伙伴们聊了 Tokenizer,经过 Tokenizer 之后,自然语言变为 Token,那么大模型就可以直接训练 Token 了嘛? 还不行! 接下来还有一个词嵌入的环境,英文就是 Embedding,Embedding 实际上就是将 Token 转为张量,在有的场景下,Embedding 也指张量本身。
7/30/2025 4:15:00 AM
江南一点雨
只需一次指令微调,大模型变身全能专家天团,8B模型性能反超全微调基线 | ACL25 Oral
只需一次指令微调,即可让普通大模型变身“全能专家天团”? 改造位置自动定位专家协作动态平衡8B模型性能反超全微调基线1.6%,安全指标暴涨10%,推理内存直降30%! 图片当前预训练语言大模型(LLM)虽具备通用能力,但适应专业领域需高昂的指令微调成本;稀疏混合专家(SMoE)架构作为可扩展的性能-效率平衡框架,虽能提升推理效率并灵活扩展模型容量,但其从头训练消耗巨大资源,因此复用密集大模型参数的升级改造(LLM Upcycling)成为更具成本效益的替代方案。
7/29/2025 2:12:00 AM
百元级硬件流畅运行百亿参数大模型!上交&本智激活开源端侧原生大模型
AI的下一个战场,不在云端,而在你的口袋里。 iPhone、华为、三星、小米、OPPO等各大手机厂商几乎都在将大模型塞进手机,端侧AI已然成为兵家必争之地。 背后的逻辑清晰而坚定:最懂你的AI,必须能安全地访问你的个人数据——邮件、照片、日程,而这一切的前提,就是将计算留在本地,将隐私还给用户。
7/28/2025 9:06:00 AM
大模型“天梯赛”来了,让Agent在Kaggle真实任务中进化|佐治亚理工、斯坦福开源
当前最强大的大语言模型(LLM)虽然代码能力飞速发展,但在解决真实、复杂的机器学习工程(MLE)任务时,仍像是在进行一场“闭卷考试”。 它们可以在单次尝试中生成代码,却无法模拟人类工程师那样,在反复的实验、调试、反馈和优化中寻找最优解的真实工作流。 为了打破这一瓶颈,来自佐治亚理工学院和斯坦福大学的研究团队正式推出了 MLE-Dojo,一个专为训练和评测大模型智能体(LLM Agents)设计的“交互式武馆”。
7/28/2025 8:45:00 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
论文
代码
LLM
算法
Stable Diffusion
芯片
腾讯
AI for Science
苹果
Agent
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
研究
人形机器人
生成
AI视频
百度
工具
RAG
大语言模型
Sora
华为
GPU
计算
具身智能
AI设计
字节跳动
搜索
大型语言模型
AGI
场景
深度学习
视频生成
架构
预测
视觉
伟达
DeepMind
Transformer
编程
神器推荐
AI模型
亚马逊
MCP