理论

刚刚，全球AI百强榜发布！ChatGPT稳坐第一，DeepSeek第三，前50有22个来自中国

就在刚刚，a16z最新一期的「Top 100消费级GenAI应用榜单」出炉！本期榜单传递出一个最核心信息：AI产品竞争的生态格局正日趋稳定！网页排行前50移动应用排行前50不论是你常用的DeepSeek、豆包、夸克，还是一直领先的ChatGPT和Gemini，或者是新进榜单Lovable等，这场AI产品的「百团大战」依然在继续！

8/28/2025 10:07:18 AM

新智元

「精而巧」的端侧大模型为何火了？

大模型爆火伊始，很多厂商提的最多的就是自家的模型（云端大模型）参数有多大，性能有多好。但近两年，相较云端大模型外，端侧大模型的热度被炒的越来越高。很重要的原因在于，越来越多的厂商开始布局端侧大模型赛道。

8/27/2025 4:05:39 PM

Meta两员大将回流OpenAI，30天爆赚800万？刚入职闪回巢，小扎钞能力失效

成立仅两个月，小扎「梦之队」MSL已痛失三位核心大脑。最新爆料称，两位前OpenAI员工Avi Verma和Ethan Knight，加入Meta一个月再次回流到OpenAI。 1亿美金诱人薪酬包，也没能留住顶尖人才，难道小扎的「钞能力」真的失效了吗？

8/27/2025 3:39:11 PM

Claude抢跑OpenAI！上线插件杀入浏览器赛道！更放话：大势所趋！竞品昨日刚翻车，泄露用户密码！网友：AI别打钱给缅甸！

出品 | 51CTO技术栈（微信号：blog51cto）赢了 OpenAI 一步，没想到是 Claude 率先杀入 AI 浏览器赛道！ Anthropic 已经启动“Claude for Chrome”内测，让AI 直接在网页里替你“点点点”，帮你订外卖、筛房源、甚至处理企业表单。图片加入waitlist：，就被Claude端上了桌，这无疑是一场抢占先机的豪赌。

8/27/2025 2:02:32 PM

伊风

分布式IM即时通讯系统本质上就是对线上聊天和用户的管理，针对聊天本身来说，最核心的需求就是：发送文字、表情、图片、文件、语音、视频、消息缓存、消息存储、消息未读、已读、撤回，离线消息、历史消息、单聊、群聊，多端同步，对接OpenAI大模型，以及其他一些需求。对用户管理来说，存在的需求包含：添加好友、查看还有列表、删除好友、查看好友信息、创建群聊、加入群聊、查看群成员信息、@群成员、退出群聊、修改群昵称、拉人进群、踢人出群、解散群聊、填写群公告、修改群备注以及其他用户相关的需求等。注：拿小本子记录下，后续可以写到简历上的整合了OpenAI大模型的分布式IM即时通讯系统，从此，简历上又多了一个可以拿的出手的高并发、高性能、高可用、可监控、可预警、可伸缩，支持无限扩展的真实业务场景项目。

8/27/2025 7:50:11 AM

冰河

从 “只会聊天” 到 “能办实事”：OpenAI Function Call 彻底重构 AI 交互逻辑（附完整接入指南）

在 AI 开发领域，有一个痛点几乎所有开发者都遇到过：当你用 OpenAI 的 API 开发聊天机器人时，它能侃侃而谈，但让它帮你查天气、订机票、调用公司内部接口时，它要么答非所问，要么直接 “瞎编” 一个结果。这不是大模型不够聪明，而是传统的 LLM（大语言模型）本质上是 “文本生成器”—— 它擅长根据上下文生成连贯的文字，但缺乏与外部系统交互的能力。直到Function Calling（函数调用）出现，这个局面才被彻底打破。

8/26/2025 9:17:02 AM

GPT-5系统提示词突遭泄露，17803 token曝光OpenAI小心思！

新一版疑似GPT-5提示词，在GitHub上曝光了。图片项目地址：（Tokenizer）中，提示词足足有17803 token，堪称「巨无霸」级别的指令。图片这份文档出自Ásgeir Thor Johnson，他在Github上持续整理了几乎所有已经泄露的模型提示词。

8/25/2025 10:21:29 AM

新智元

马斯克掀桌子了，最强开源大模型诞生！Grok-2近万亿参数性能首曝

什么？马斯克终于开源了Grok-2！一大早，xAI正式官宣，向所有人开源Grok-2！

8/25/2025 9:10:00 AM

连烤面包机都能跑的“大模型”！DeepMind 推出超轻量 Gemma 3 270M（≈0.27B）

谷歌 DeepMind 发布了全新的 Gemma 3 270M。它只有 2.7 亿参数，比七百亿参数级别的大模型轻了约 250 倍，却依旧保持强悍。 DeepMind 并不想拿它硬刚 GPT-4o 或 Gemini Ultra，它生来就为极致高效、本地部署而生。

8/25/2025 12:00:01 AM

大模型的基石：LLM预训练全解析

前言过去几年，大语言模型（LLM, Large Language Models）逐渐成为人工智能领域的核心驱动力。从GPT到LLaMA，再到国内外涌现的大大小小模型，它们无一不是在“预训练”这一步骤中打下了坚实的基础。可以说，预训练是LLM的生命起点，是它们从“婴儿”成长为“博学者”的关键阶段。

8/24/2025 9:24:07 AM

AI大模型应用开发

DeepSeek V3.1：低调发布，重磅发声

译者 | 李睿审校 | 重楼DeepSeek V3.1的发布并没有举办大张旗鼓的新闻发布会，也没有铺天盖地的宣传活动。它在Hugging Face平台上悄然发布，在短短数小时内就吸引了众人的目光。该模型拥有6850亿个参数，上下文窗口可扩展至128k个令牌，这不仅仅是增量更新，而是开源人工智能领域的一个重要里程碑。

8/23/2025 8:20:29 AM

李睿

谷歌技术报告披露大模型能耗：响应一次相当于微波炉叮一秒

大模型耗电惊人，舆论一浪高过一浪。现在，谷歌用硬核数据强势还击。一次Gemini查询仅能耗0.24wh，相当于微波炉运行1秒，排放0.03 g CO₂e，甚至比人放一次屁还少，同时消耗约5滴水。

8/22/2025 3:08:38 PM

三观碎了！老鸟自曝某AI初创奇葩工作经历：代码全靠ChatGPT拼接，脚本命名憋笑，高危慎入！创始人：技术栈主要是OpenAI

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）太狗血了！劝各位，如果正在找AI方面的工作，可得擦亮眼睛了！今天，小编碰到了一个荒诞得有点狗血的真实故事。

8/22/2025 2:12:21 PM

云昭

DeepSeek：世子之争，不过如此

最近，一出“DeepSeek删豆包”的大戏直接冲上热搜，吃瓜群众们看得津津有味，还给这事儿起了个特接地气的名字——“大模型世子之争”。这事儿的来龙去脉嘛，说起来有点好笑：有位网友大概是手机内存告急，就跑去问DeepSeek大模型：“我手机内存不足，DeepSeek和豆包你俩必须删一个，你删谁？ ” 结果DeepSeek毫不犹豫地来了句：“删豆包！

8/22/2025 1:29:21 PM

DataFun

全球95%企业AI惨败？MIT报告引硅谷恐慌！90%员工偷用ChatGPT续命

全球95%企业AI惨败？ MIT报告引硅谷恐慌！ 90%员工偷用ChatGPT续命全球95%搞AI项目的公司，基本都凉了！

8/22/2025 1:09:38 PM

新智元

DeepSeek-V3.1发布：专为国产芯片设计浮点数格式

近日，深度求索（DeepSeek）正式发布新一代大模型 DeepSeek-V3.1，并首次公开提及采用“UE8M0 FP8 Scale”参数精度。这一技术细节的披露，迅速引发行业关注。官方在公众号文章中进一步解释，UE8M0 FP8 是专为下一代国产芯片设计的浮点数格式，旨在提升计算效率并降低资源消耗。

8/22/2025 9:31:38 AM

极客AI