AIGC宇宙 AIGC宇宙

理论

大模型全面爆发,所有榜一都是Gemini!谷歌一夜站到了台前

北京时间今天凌晨 1 点,今年的 Google I/O 2025 开发者大会正式开启。 谷歌最近的大模型技术风头正劲,今年的这场「科技春晚」吸引了全球关注的目光。 没有意外,今年的核心主题自然是 AI。
5/21/2025 9:40:11 AM
机器之心

史上最强AI全家桶!谷歌Gemini 2.5双杀OpenAI,上架250美金天价VIP

谷歌又双叒叕搞事情啦! 昨天,谷歌推出了一款超强的编程智能体Jules,已进入全球测试阶段。 任何拥有Google账户的开发者都可以使用,提供每日5次免费任务。
5/21/2025 9:15:00 AM

解锁 LLM 新高度!一文深度解读 Qwen3 大模型​

1、模型架构Qwen3 系列涵盖 6 种密集型模型和 2 种 MoE 模型,参数规模从 0.6 亿到 2350 亿不等,满足不同下游应用需求。 旗舰模型 Qwen3-235B-A22B 作为 MoE 模型,总参数量达 2350 亿,每 token 激活参数量为 220 亿,在性能与效率间取得平衡。 密集型模型Qwen3 的密集型模型架构与 Qwen2.5 类似,采用 Grouped Query Attention(GQA)和 QK-Norm 改进注意力机制,使用 SwiGLU 作为激活函数,搭配 Rotary Positional Embeddings(RoPE)进行位置编码,采用 RMSNorm 并预归一化。
5/21/2025 9:04:38 AM
Goldma

CoT推理大溃败?哈佛华人揭秘:LLM一思考,立刻就「失智」

DeepSeek-R1火了,推理模型火了,思维链(Chain-of-Thought,CoT)火了! 模型很聪明,问题是:它还听你的话吗? 思维链很好,但代价呢?
5/21/2025 9:02:20 AM

骄傲藏不住!谷歌CEO劈柴哥5.20深夜开大:15项重磅炸弹,两大Gemini前沿方向!中国队Xreal成为谷歌XR原型机代表

编辑 | 云昭北京时间5月21日凌晨1点,谷歌 CEO Sundar Pichai 准点走进坐落于加州山景城的著名露天圆形剧场 Shoreline Amphitheatre,发表了 Google IO 2025 大会的主题演讲。 全程一部定影的时间, 115 分钟,可谓是给 5.20 的深夜奉上了一场别样的谷歌之声。 先说整体感受,整体上如大部分媒体所预料的:Andriod 已经退出焦点,AI 可以说是全部。
5/21/2025 7:45:43 AM
云昭

RAG与微调,大语言模型的“大脑升级”,该选哪条路?(小白科普)

最近在做项目时,我发现有些甲方对RAG和模型微调分区的不太清楚,明明大语言模型(LLM)加挂RAG就可以解决的问题,却坚持要微调,但是具体沟通后发现,其实只是不太了解二者的实际用途。 其实,Retrieval-Augmented Generation (RAG) 和微调 (Fine-Tuning) 是两种最常用的LLM的“大脑升级”技术,虽然它们都能提升模型的性能,但工作原理和适用场景却大相径庭。 今天,我就来深入聊聊这两种技术,弄清楚在不同情况下,到底该选 RAG 还是微调。
5/21/2025 3:00:00 AM
贝塔街的万事屋

几行代码让自家网站秒变ChatGPT!微软Build上神秘开源协议,掀起第四次计算革命!网友:OpenAI的霸主时代被终结?

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)昨天的微软 Build 2025 开发者大会,用一句话总结就是:信息密度爆表,炸点不断! 如果你是开源党的信徒——这次微软几乎把压箱底的宝贝都掏了出来:GitHub Copilot for VS Code 项目正式开源! 而且直接采用了 MIT 协议,意味着全球开发者不仅能免费访问源码、研究核心逻辑,还能亲自下场参与改进,Copilot 从此变成了真正意义上的“全民AI助手”。
5/20/2025 6:33:37 PM
伊风

60+头部企业关于AI的思想碰撞,都在这场大会里

最近由150位全球顶尖AI创始人参与的红杉资本AI峰会刷爆AI产业圈,关于大热的智能体经济、大模型、机器人商业化...来自OpenAI、英伟达、谷歌等公司的AI大佬们给出了他们的洞察——AI不再卖工具,而是卖收益。 它正在从“技术产品”进化为一种新的经济运行方式。 这一观点通俗来讲,就是客户不会因为你的AI产品功能好不好来买单,他们只为能帮他挣钱的产品买单。
5/20/2025 3:36:54 PM

深度解析大模型技术演进脉络:RAG、Agent与多模态的实战经验与未来图景

作者 | jaymie大模型作为产业变革的核心引擎。 通过RAG、Agent与多模态技术正在重塑AI与现实的交互边界。 三者协同演进,不仅攻克了数据时效性、专业适配等核心挑战,更推动行业从效率革新迈向业务重构。
5/20/2025 8:30:00 AM
腾讯技术工程

Transformer 模型结构详解及代码实现!

一、Transformer简要发展史以下是Transformer模型发展历史中的关键节点:Transformer架构于2017年6月推出。 原本研究的重点是翻译任务。 随后推出了几个有影响力的模型,包括:时间模型简要说明2017 年 6 月「Transformer」Google 首次提出基于 Attention 的模型,用于机器翻译任务2018 年 6 月「GPT」第一个使用 Transformer 解码器模块进行预训练的语言模型,适用于多种 NLP 任务2018 年 10 月「BERT」使用 Transformer 编码器模块,通过掩码语言建模生成更强大的句子表示2019 年 2 月「GPT-2」更大更强的 GPT 版本,由于潜在风险未立即发布,具备出色的文本生成能力2019 年 10 月「DistilBERT」BERT 的轻量化版本,在保留 97% 性能的同时,速度更快、内存占用更低2019 年 10 月「BART、T5」使用完整的 Encoder-Decoder 架构,在各种 NLP 任务中表现优异2020 年 5 月「GPT-3」超大规模语言模型,支持“零样本学习”,无需微调即可完成新任务这个列表并不全面,只是为了突出一些不同类型的 Transformer 模型。
5/20/2025 8:15:00 AM
郭小喵玩AI

调查显示67%的工作使用AI,但领导者是否了解其局限性?

在一份针对1000名知识型员工的调查中,67%的受访者表示其所在公司使用AI,其中56%的公司鼓励员工使用AI。 该调查由Owl Labs发起,他们发现Z世代员工更有可能表示自己“高度依赖”AI,其中70%的最年轻一代员工在工作中依赖这项技术完成多项任务。 这与OpenAI CEO萨姆·奥特曼(Sam Altman)的观察一致,他最近表示,Z世代员工将ChatGPT视为“人生顾问”。
5/19/2025 3:06:44 PM
Chris

使用 Unsloth 高效微调 Qwen3,国产大模型的轻量化和部署实践

近年来,大语言模型在自然语言处理任务中取得了显著进展。 然而,对于开发者和中小型企业,模型微调的资源需求仍是一个挑战。 本文将讨论如何利用 Unsloth 框架,在有限的硬件资源下完成 Qwen3-14B 的高效微调,并支持后续部署。
5/19/2025 9:32:06 AM
口袋数据

北大DeepSeek论文或预定ACL Best Paper!梁文锋署名

重磅惊喜! 北大与DeepSeek合作,并由梁文锋亲自提交到arXiv的论文,将有望斩获ACL 2025最佳论文(ACL Best Paper)。 图片论文地址:,总投稿数高达8000多篇,创历史之最,而ACL 2024总投稿数仅为4407,几乎翻倍!
5/19/2025 9:12:16 AM
新智元

OpenAI发布代码Agent:开启自动化编程时代,超强智能体!

OpenAI在官网发布了一个全新基于云端的代码Agent——Codex。 Codex可以为开发人员自动执行多种任务,例如,编写功能代码、回答有关代码库的问题、修复错误以及提出拉取请求审查等;每个任务都在自己的云端沙盒环境中运行,同时能预加载用户的代码库。 据悉,Codex由Codex-1模型提供支持,这是OpenAI-o3的一个微调版本,专门针对软件工程进行了优化。
5/19/2025 9:10:00 AM

最新!OpenAI:GPT-5将实现大统一,Codex最佳实践是这样的

Codex发布后,OpenAI Codex在Reddit举行了AMA(Ask Me Anything)活动在这场 1 小时的 AMA 中,Codex 核心研发和研究负责人围绕 :为什么先推云端代理、CLI 为何用 TypeScript、未来多语言绑定与 IDE 插件、GPT-5 与 Operator 的整合、定价与 API 计划、安全沙箱、最佳实践 等问题给出了清晰路线图:Codex-1 目前是「云端沙箱 ChatGPT 原生入口」的研究预览,面向大仓库 测试驱动工作流效果最佳;CLI 走开源 API 计费,本体将在 Plus/Pro 长期集成并提供“弹性”付费;短期不会给代理外网,但已支持 --approval-mode full-auto;他们希望 10 年内实现“按规格即可落地可靠软件”,并把 Codex、Operator、Deep Research、Memory 等工具融合为一套完整代理体系详细 Q&ACodex产品定位与长期愿景1 .为什么先做云端本地 CLI 因单机算力与线程受限,只适合轻量任务;云端可并行跑多个容器并隔离风险,是先发形态10 年愿景:给出“合理规格说明”即可在可观时间内得到可靠软件;云端并行 沙箱是实现路径。 2 .GPT-5 与 Codex、Operator 等工具是什么关系?
5/19/2025 8:58:00 AM

编程革命彻底爆发!刚刚,OpenAI最强智能体上线ChatGPT

从今天起,AI编程正式开启新时代! 刚刚,Greg Brockman带队与OpenAI六人团队开启线上直播,震撼发布了一款云端AI编程智能体——Codex。 用奥特曼的话来说就是,一个人就能打造无数爆款应用的时代来了!
5/17/2025 8:55:41 AM
新智元

刚刚,OpenAI丢出最强编程智能体Codex!倒反天罡——新上线功能竟是微软Copilotb鼻祖?

OpenAI在本周末尾丢出重磅炸弹! 新的AI编程智能体Codex的研究预览版现身。 这是该OpenAI迄今为止最强大的AI编程代理,不夸张地说,这就是雇佣最会编程的AI来帮助我们敲代码。
5/17/2025 8:39:52 AM
伊风

AI 教父认错!Geoffrey Hinton改口:当年看走眼了,不该给放射科医生判“死缓”

最近,AI圈因为一个“旧闻新提”变得有意思。 主角是Geoffrey Hinton,AI教父级人物,图灵奖得主。 据科技媒体《the-decoder》报道,他在接受《纽约时报》采访时,坦诚自己当年对AI取代放射科医生的预测,有点“过于乐观”了。
5/16/2025 1:45:36 PM