理论

大模型全面爆发，所有榜一都是Gemini！谷歌一夜站到了台前

北京时间今天凌晨 1 点，今年的 Google I/O 2025 开发者大会正式开启。谷歌最近的大模型技术风头正劲，今年的这场「科技春晚」吸引了全球关注的目光。没有意外，今年的核心主题自然是 AI。

5/21/2025 9:40:11 AM

机器之心

史上最强AI全家桶！谷歌Gemini 2.5双杀OpenAI，上架250美金天价VIP

谷歌又双叒叕搞事情啦！昨天，谷歌推出了一款超强的编程智能体Jules，已进入全球测试阶段。任何拥有Google账户的开发者都可以使用，提供每日5次免费任务。

5/21/2025 9:15:00 AM

解锁 LLM 新高度！一文深度解读 Qwen3 大模型

1、模型架构Qwen3 系列涵盖 6 种密集型模型和 2 种 MoE 模型，参数规模从 0.6 亿到 2350 亿不等，满足不同下游应用需求。旗舰模型 Qwen3-235B-A22B 作为 MoE 模型，总参数量达 2350 亿，每 token 激活参数量为 220 亿，在性能与效率间取得平衡。密集型模型Qwen3 的密集型模型架构与 Qwen2.5 类似，采用 Grouped Query Attention（GQA）和 QK-Norm 改进注意力机制，使用 SwiGLU 作为激活函数，搭配 Rotary Positional Embeddings（RoPE）进行位置编码，采用 RMSNorm 并预归一化。

5/21/2025 9:04:38 AM

Goldma

CoT推理大溃败？哈佛华人揭秘：LLM一思考，立刻就「失智」

DeepSeek-R1火了，推理模型火了，思维链（Chain-of-Thought，CoT）火了！模型很聪明，问题是：它还听你的话吗？思维链很好，但代价呢？

5/21/2025 9:02:20 AM

骄傲藏不住！谷歌CEO劈柴哥5.20深夜开大：15项重磅炸弹，两大Gemini前沿方向！中国队Xreal成为谷歌XR原型机代表

编辑｜云昭北京时间5月21日凌晨1点，谷歌 CEO Sundar Pichai 准点走进坐落于加州山景城的著名露天圆形剧场 Shoreline Amphitheatre，发表了 Google IO 2025 大会的主题演讲。全程一部定影的时间， 115 分钟，可谓是给 5.20 的深夜奉上了一场别样的谷歌之声。先说整体感受，整体上如大部分媒体所预料的：Andriod 已经退出焦点，AI 可以说是全部。

5/21/2025 7:45:43 AM

云昭

RAG与微调，大语言模型的“大脑升级”，该选哪条路？（小白科普）

最近在做项目时，我发现有些甲方对RAG和模型微调分区的不太清楚，明明大语言模型（LLM）加挂RAG就可以解决的问题，却坚持要微调，但是具体沟通后发现，其实只是不太了解二者的实际用途。其实，Retrieval-Augmented Generation (RAG) 和微调 (Fine-Tuning) 是两种最常用的LLM的“大脑升级”技术，虽然它们都能提升模型的性能，但工作原理和适用场景却大相径庭。今天，我就来深入聊聊这两种技术，弄清楚在不同情况下，到底该选 RAG 还是微调。

5/21/2025 3:00:00 AM

贝塔街的万事屋

几行代码让自家网站秒变ChatGPT！微软Build上神秘开源协议，掀起第四次计算革命！网友：OpenAI的霸主时代被终结？

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）昨天的微软 Build 2025 开发者大会，用一句话总结就是：信息密度爆表，炸点不断！如果你是开源党的信徒——这次微软几乎把压箱底的宝贝都掏了出来：GitHub Copilot for VS Code 项目正式开源！而且直接采用了 MIT 协议，意味着全球开发者不仅能免费访问源码、研究核心逻辑，还能亲自下场参与改进，Copilot 从此变成了真正意义上的“全民AI助手”。

5/20/2025 6:33:37 PM

伊风

60+头部企业关于AI的思想碰撞，都在这场大会里

最近由150位全球顶尖AI创始人参与的红杉资本AI峰会刷爆AI产业圈，关于大热的智能体经济、大模型、机器人商业化...来自OpenAI、英伟达、谷歌等公司的AI大佬们给出了他们的洞察——AI不再卖工具，而是卖收益。它正在从“技术产品”进化为一种新的经济运行方式。这一观点通俗来讲，就是客户不会因为你的AI产品功能好不好来买单，他们只为能帮他挣钱的产品买单。

5/20/2025 3:36:54 PM

深度解析大模型技术演进脉络：RAG、Agent与多模态的实战经验与未来图景

作者 | jaymie大模型作为产业变革的核心引擎。通过RAG、Agent与多模态技术正在重塑AI与现实的交互边界。三者协同演进，不仅攻克了数据时效性、专业适配等核心挑战，更推动行业从效率革新迈向业务重构。

5/20/2025 8:30:00 AM

腾讯技术工程

Transformer 模型结构详解及代码实现!

一、Transformer简要发展史以下是Transformer模型发展历史中的关键节点：Transformer架构于2017年6月推出。原本研究的重点是翻译任务。随后推出了几个有影响力的模型，包括：时间模型简要说明2017 年 6 月「Transformer」Google 首次提出基于 Attention 的模型，用于机器翻译任务2018 年 6 月「GPT」第一个使用 Transformer 解码器模块进行预训练的语言模型，适用于多种 NLP 任务2018 年 10 月「BERT」使用 Transformer 编码器模块，通过掩码语言建模生成更强大的句子表示2019 年 2 月「GPT-2」更大更强的 GPT 版本，由于潜在风险未立即发布，具备出色的文本生成能力2019 年 10 月「DistilBERT」BERT 的轻量化版本，在保留 97% 性能的同时，速度更快、内存占用更低2019 年 10 月「BART、T5」使用完整的 Encoder-Decoder 架构，在各种 NLP 任务中表现优异2020 年 5 月「GPT-3」超大规模语言模型，支持“零样本学习”，无需微调即可完成新任务这个列表并不全面，只是为了突出一些不同类型的 Transformer 模型。

5/20/2025 8:15:00 AM

郭小喵玩AI

调查显示67%的工作使用AI，但领导者是否了解其局限性？

在一份针对1000名知识型员工的调查中，67%的受访者表示其所在公司使用AI，其中56%的公司鼓励员工使用AI。该调查由Owl Labs发起，他们发现Z世代员工更有可能表示自己“高度依赖”AI，其中70%的最年轻一代员工在工作中依赖这项技术完成多项任务。这与OpenAI CEO萨姆·奥特曼(Sam Altman)的观察一致，他最近表示，Z世代员工将ChatGPT视为“人生顾问”。

5/19/2025 3:06:44 PM

Chris

使用 Unsloth 高效微调 Qwen3，国产大模型的轻量化和部署实践

近年来，大语言模型在自然语言处理任务中取得了显著进展。然而，对于开发者和中小型企业，模型微调的资源需求仍是一个挑战。本文将讨论如何利用 Unsloth 框架，在有限的硬件资源下完成 Qwen3-14B 的高效微调，并支持后续部署。

5/19/2025 9:32:06 AM

口袋数据

北大DeepSeek论文或预定ACL Best Paper！梁文锋署名

重磅惊喜！北大与DeepSeek合作，并由梁文锋亲自提交到arXiv的论文，将有望斩获ACL 2025最佳论文（ACL Best Paper）。图片论文地址：，总投稿数高达8000多篇，创历史之最，而ACL 2024总投稿数仅为4407，几乎翻倍！

5/19/2025 9:12:16 AM

新智元

OpenAI发布代码Agent：开启自动化编程时代，超强智能体！

OpenAI在官网发布了一个全新基于云端的代码Agent——Codex。 Codex可以为开发人员自动执行多种任务，例如，编写功能代码、回答有关代码库的问题、修复错误以及提出拉取请求审查等；每个任务都在自己的云端沙盒环境中运行，同时能预加载用户的代码库。据悉，Codex由Codex-1模型提供支持，这是OpenAI-o3的一个微调版本，专门针对软件工程进行了优化。

5/19/2025 9:10:00 AM

最新！OpenAI：GPT-5将实现大统一，Codex最佳实践是这样的

Codex发布后，OpenAI Codex在Reddit举行了AMA（Ask Me Anything）活动在这场 1 小时的 AMA 中，Codex 核心研发和研究负责人围绕：为什么先推云端代理、CLI 为何用 TypeScript、未来多语言绑定与 IDE 插件、GPT-5 与 Operator 的整合、定价与 API 计划、安全沙箱、最佳实践等问题给出了清晰路线图：Codex-1 目前是「云端沙箱 ChatGPT 原生入口」的研究预览，面向大仓库测试驱动工作流效果最佳；CLI 走开源 API 计费，本体将在 Plus/Pro 长期集成并提供“弹性”付费；短期不会给代理外网，但已支持 --approval-mode full-auto；他们希望 10 年内实现“按规格即可落地可靠软件”，并把 Codex、Operator、Deep Research、Memory 等工具融合为一套完整代理体系详细 Q&ACodex产品定位与长期愿景1 .为什么先做云端本地 CLI 因单机算力与线程受限，只适合轻量任务；云端可并行跑多个容器并隔离风险，是先发形态10 年愿景：给出“合理规格说明”即可在可观时间内得到可靠软件；云端并行沙箱是实现路径。 2 .GPT-5 与 Codex、Operator 等工具是什么关系？

5/19/2025 8:58:00 AM