理论
大模型全面爆发,所有榜一都是Gemini!谷歌一夜站到了台前
北京时间今天凌晨 1 点,今年的 Google I/O 2025 开发者大会正式开启。 谷歌最近的大模型技术风头正劲,今年的这场「科技春晚」吸引了全球关注的目光。 没有意外,今年的核心主题自然是 AI。
5/21/2025 9:40:11 AM
机器之心
史上最强AI全家桶!谷歌Gemini 2.5双杀OpenAI,上架250美金天价VIP
谷歌又双叒叕搞事情啦! 昨天,谷歌推出了一款超强的编程智能体Jules,已进入全球测试阶段。 任何拥有Google账户的开发者都可以使用,提供每日5次免费任务。
5/21/2025 9:15:00 AM
解锁 LLM 新高度!一文深度解读 Qwen3 大模型
1、模型架构Qwen3 系列涵盖 6 种密集型模型和 2 种 MoE 模型,参数规模从 0.6 亿到 2350 亿不等,满足不同下游应用需求。 旗舰模型 Qwen3-235B-A22B 作为 MoE 模型,总参数量达 2350 亿,每 token 激活参数量为 220 亿,在性能与效率间取得平衡。 密集型模型Qwen3 的密集型模型架构与 Qwen2.5 类似,采用 Grouped Query Attention(GQA)和 QK-Norm 改进注意力机制,使用 SwiGLU 作为激活函数,搭配 Rotary Positional Embeddings(RoPE)进行位置编码,采用 RMSNorm 并预归一化。
5/21/2025 9:04:38 AM
Goldma
CoT推理大溃败?哈佛华人揭秘:LLM一思考,立刻就「失智」
DeepSeek-R1火了,推理模型火了,思维链(Chain-of-Thought,CoT)火了! 模型很聪明,问题是:它还听你的话吗? 思维链很好,但代价呢?
5/21/2025 9:02:20 AM
骄傲藏不住!谷歌CEO劈柴哥5.20深夜开大:15项重磅炸弹,两大Gemini前沿方向!中国队Xreal成为谷歌XR原型机代表
编辑 | 云昭北京时间5月21日凌晨1点,谷歌 CEO Sundar Pichai 准点走进坐落于加州山景城的著名露天圆形剧场 Shoreline Amphitheatre,发表了 Google IO 2025 大会的主题演讲。 全程一部定影的时间, 115 分钟,可谓是给 5.20 的深夜奉上了一场别样的谷歌之声。 先说整体感受,整体上如大部分媒体所预料的:Andriod 已经退出焦点,AI 可以说是全部。
5/21/2025 7:45:43 AM
云昭
RAG与微调,大语言模型的“大脑升级”,该选哪条路?(小白科普)
最近在做项目时,我发现有些甲方对RAG和模型微调分区的不太清楚,明明大语言模型(LLM)加挂RAG就可以解决的问题,却坚持要微调,但是具体沟通后发现,其实只是不太了解二者的实际用途。 其实,Retrieval-Augmented Generation (RAG) 和微调 (Fine-Tuning) 是两种最常用的LLM的“大脑升级”技术,虽然它们都能提升模型的性能,但工作原理和适用场景却大相径庭。 今天,我就来深入聊聊这两种技术,弄清楚在不同情况下,到底该选 RAG 还是微调。
5/21/2025 3:00:00 AM
贝塔街的万事屋
几行代码让自家网站秒变ChatGPT!微软Build上神秘开源协议,掀起第四次计算革命!网友:OpenAI的霸主时代被终结?
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)昨天的微软 Build 2025 开发者大会,用一句话总结就是:信息密度爆表,炸点不断! 如果你是开源党的信徒——这次微软几乎把压箱底的宝贝都掏了出来:GitHub Copilot for VS Code 项目正式开源! 而且直接采用了 MIT 协议,意味着全球开发者不仅能免费访问源码、研究核心逻辑,还能亲自下场参与改进,Copilot 从此变成了真正意义上的“全民AI助手”。
5/20/2025 6:33:37 PM
伊风
60+头部企业关于AI的思想碰撞,都在这场大会里
最近由150位全球顶尖AI创始人参与的红杉资本AI峰会刷爆AI产业圈,关于大热的智能体经济、大模型、机器人商业化...来自OpenAI、英伟达、谷歌等公司的AI大佬们给出了他们的洞察——AI不再卖工具,而是卖收益。 它正在从“技术产品”进化为一种新的经济运行方式。 这一观点通俗来讲,就是客户不会因为你的AI产品功能好不好来买单,他们只为能帮他挣钱的产品买单。
5/20/2025 3:36:54 PM
深度解析大模型技术演进脉络:RAG、Agent与多模态的实战经验与未来图景
作者 | jaymie大模型作为产业变革的核心引擎。 通过RAG、Agent与多模态技术正在重塑AI与现实的交互边界。 三者协同演进,不仅攻克了数据时效性、专业适配等核心挑战,更推动行业从效率革新迈向业务重构。
5/20/2025 8:30:00 AM
腾讯技术工程
Transformer 模型结构详解及代码实现!
一、Transformer简要发展史以下是Transformer模型发展历史中的关键节点:Transformer架构于2017年6月推出。 原本研究的重点是翻译任务。 随后推出了几个有影响力的模型,包括:时间模型简要说明2017 年 6 月「Transformer」Google 首次提出基于 Attention 的模型,用于机器翻译任务2018 年 6 月「GPT」第一个使用 Transformer 解码器模块进行预训练的语言模型,适用于多种 NLP 任务2018 年 10 月「BERT」使用 Transformer 编码器模块,通过掩码语言建模生成更强大的句子表示2019 年 2 月「GPT-2」更大更强的 GPT 版本,由于潜在风险未立即发布,具备出色的文本生成能力2019 年 10 月「DistilBERT」BERT 的轻量化版本,在保留 97% 性能的同时,速度更快、内存占用更低2019 年 10 月「BART、T5」使用完整的 Encoder-Decoder 架构,在各种 NLP 任务中表现优异2020 年 5 月「GPT-3」超大规模语言模型,支持“零样本学习”,无需微调即可完成新任务这个列表并不全面,只是为了突出一些不同类型的 Transformer 模型。
5/20/2025 8:15:00 AM
郭小喵玩AI
调查显示67%的工作使用AI,但领导者是否了解其局限性?
在一份针对1000名知识型员工的调查中,67%的受访者表示其所在公司使用AI,其中56%的公司鼓励员工使用AI。 该调查由Owl Labs发起,他们发现Z世代员工更有可能表示自己“高度依赖”AI,其中70%的最年轻一代员工在工作中依赖这项技术完成多项任务。 这与OpenAI CEO萨姆·奥特曼(Sam Altman)的观察一致,他最近表示,Z世代员工将ChatGPT视为“人生顾问”。
5/19/2025 3:06:44 PM
Chris
使用 Unsloth 高效微调 Qwen3,国产大模型的轻量化和部署实践
近年来,大语言模型在自然语言处理任务中取得了显著进展。 然而,对于开发者和中小型企业,模型微调的资源需求仍是一个挑战。 本文将讨论如何利用 Unsloth 框架,在有限的硬件资源下完成 Qwen3-14B 的高效微调,并支持后续部署。
5/19/2025 9:32:06 AM
口袋数据
北大DeepSeek论文或预定ACL Best Paper!梁文锋署名
重磅惊喜! 北大与DeepSeek合作,并由梁文锋亲自提交到arXiv的论文,将有望斩获ACL 2025最佳论文(ACL Best Paper)。 图片论文地址:,总投稿数高达8000多篇,创历史之最,而ACL 2024总投稿数仅为4407,几乎翻倍!
5/19/2025 9:12:16 AM
新智元
OpenAI发布代码Agent:开启自动化编程时代,超强智能体!
OpenAI在官网发布了一个全新基于云端的代码Agent——Codex。 Codex可以为开发人员自动执行多种任务,例如,编写功能代码、回答有关代码库的问题、修复错误以及提出拉取请求审查等;每个任务都在自己的云端沙盒环境中运行,同时能预加载用户的代码库。 据悉,Codex由Codex-1模型提供支持,这是OpenAI-o3的一个微调版本,专门针对软件工程进行了优化。
5/19/2025 9:10:00 AM
最新!OpenAI:GPT-5将实现大统一,Codex最佳实践是这样的
Codex发布后,OpenAI Codex在Reddit举行了AMA(Ask Me Anything)活动在这场 1 小时的 AMA 中,Codex 核心研发和研究负责人围绕 :为什么先推云端代理、CLI 为何用 TypeScript、未来多语言绑定与 IDE 插件、GPT-5 与 Operator 的整合、定价与 API 计划、安全沙箱、最佳实践 等问题给出了清晰路线图:Codex-1 目前是「云端沙箱 ChatGPT 原生入口」的研究预览,面向大仓库 测试驱动工作流效果最佳;CLI 走开源 API 计费,本体将在 Plus/Pro 长期集成并提供“弹性”付费;短期不会给代理外网,但已支持 --approval-mode full-auto;他们希望 10 年内实现“按规格即可落地可靠软件”,并把 Codex、Operator、Deep Research、Memory 等工具融合为一套完整代理体系详细 Q&ACodex产品定位与长期愿景1 .为什么先做云端本地 CLI 因单机算力与线程受限,只适合轻量任务;云端可并行跑多个容器并隔离风险,是先发形态10 年愿景:给出“合理规格说明”即可在可观时间内得到可靠软件;云端并行 沙箱是实现路径。 2 .GPT-5 与 Codex、Operator 等工具是什么关系?
5/19/2025 8:58:00 AM
编程革命彻底爆发!刚刚,OpenAI最强智能体上线ChatGPT
从今天起,AI编程正式开启新时代! 刚刚,Greg Brockman带队与OpenAI六人团队开启线上直播,震撼发布了一款云端AI编程智能体——Codex。 用奥特曼的话来说就是,一个人就能打造无数爆款应用的时代来了!
5/17/2025 8:55:41 AM
新智元
刚刚,OpenAI丢出最强编程智能体Codex!倒反天罡——新上线功能竟是微软Copilotb鼻祖?
OpenAI在本周末尾丢出重磅炸弹! 新的AI编程智能体Codex的研究预览版现身。 这是该OpenAI迄今为止最强大的AI编程代理,不夸张地说,这就是雇佣最会编程的AI来帮助我们敲代码。
5/17/2025 8:39:52 AM
伊风
AI 教父认错!Geoffrey Hinton改口:当年看走眼了,不该给放射科医生判“死缓”
最近,AI圈因为一个“旧闻新提”变得有意思。 主角是Geoffrey Hinton,AI教父级人物,图灵奖得主。 据科技媒体《the-decoder》报道,他在接受《纽约时报》采访时,坦诚自己当年对AI取代放射科医生的预测,有点“过于乐观”了。
5/16/2025 1:45:36 PM
资讯热榜
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
ChatGPT 语音功能升级,实时翻译对话更自然流畅
肝了30小时,Flux Kontext是我用过最稳、最能干活的AI图像模型!
谷歌 Gemini 应用月下载量超越 ChatGPT,用户活跃度仍显不足
长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
数据
谷歌
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
开发者
蛋白质
腾讯
神经网络
研究
3D
生成
训练
苹果
计算
智能体
Sora
机器学习
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
大语言模型
xAI
预测
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
Copilot
算力
工具
LLM
驾驶
API
大型语言模型
应用
RAG
亚马逊