文章列表
DeepSeek发布大模型训练端到端论文,展示卓越工程深度
近日,DeepSeek发布了一篇关于大模型训练的最佳端到端技术论文,引发业界广泛关注。 该论文全面阐述了DeepSeek在大模型研发中的技术突破,涵盖软件、硬件及混合优化方案,展现了其令人惊叹的工程深度。 在**软件**层面,论文详细介绍了多头潜在注意力机制(MLA),显著降低推理过程中的内存占用;FP8混合精度训练通过低精度计算提升效率,同时保证数值稳定性;DeepEP通信库优化了专家并行(EP)通信,支持FP8低精度操作,加速MoE模型训练与推理;LogFMT对数浮点格式则通过均匀化激活分布,进一步优化计算效率。
5/21/2025 11:01:05 AM
AI在线
每月249.99美元!谷歌推出 AI Ultra 订阅计划,畅享最强大 AI 模型与高级功能
谷歌宣布推出全新的 AI Ultra 订阅计划,旨在为用户提供最高级别的 AI 模型访问和丰富的高级功能。 随着人工智能技术的迅速发展,谷歌希望通过这一新计划,让更多用户能够利用其先进的 AI 能力来提升知识、创造力和工作效率。 AI Ultra 计划适合电影制作人、开发者、创意专业人士,或者任何追求最佳 AI 体验的用户,可以看作是进入谷歌 AI 世界的 “贵宾通行证”。
5/21/2025 10:01:51 AM
AI在线
谷歌推出Project Mariner,AI智能助手即将全面上线Chrome与搜索
在今日的 Google I/O2025大会上,谷歌正式发布了名为 “Project Mariner” 的新项目,标志着公司在人工智能领域的新一步。 这一项目原本被称为 “Jarvis”,并在去年年底进行了测试,现在终于迎来了更为成熟的形态。 Project Mariner 是一款强大的网络 AI 智能体,预计将在今年全面上线,旨在优化用户的浏览体验。
5/21/2025 10:01:51 AM
AI在线
谷歌的 Gemini AI 将全面革新 Android Auto,驾驶体验将更智能
在近日召开的2025年 I/O 开发者大会上,谷歌宣布通过其新推出的 Gemini AI 技术,全面升级 Android Auto 车载系统。 这一升级的核心目标是为驾驶者提供更加自然、流畅的语音交互体验,令他们在驾驶过程中无需动手即可完成多项操作。 根据科技媒体 Android Central 的报道,谷歌在会议上展示了这一技术的预发布版本,并在沃尔沃汽车上进行了试用。
5/21/2025 10:01:45 AM
AI在线
Gmail 新功能上线:Gemini AI 助力轻松管理日历事件
在2025年的 I/O 开发者大会上,谷歌宣布其移动邮件应用 Gmail 将全面整合 Gemini AI 功能,为用户带来更便捷的日历管理体验。 无论是 Android 还是 iOS 平台,用户都可以通过 Gmail 应用轻松创建、删除和编辑日历事件,并查看每日日程概览。 据悉,这一新功能允许用户在 Gmail 内直接管理日历,无需切换到其他应用。
5/21/2025 10:01:45 AM
AI在线
Google249美元订阅服务AI Ultra登场,打造AI创作“最强套装”
在2025年Google I/O开发者大会上,谷歌展示了其AI与XR技术的最新成果,覆盖创作工具、开发者平台和用户体验三大核心领域。 新一代视频生成器Veo3、图像生成器Imagen4、全新XR平台Android XR以及顶配AI订阅服务“AI Ultra”成为发布会焦点。 作为AI创作工具的重磅升级,Veo3可生成原生音轨视频,区别于OpenAI Sora等当前不支持音频的产品,现已面向美国Ultra订阅用户及Vertex AI企业客户开放。
5/21/2025 10:01:02 AM
AI在线
大模型全面爆发,所有榜一都是Gemini!谷歌一夜站到了台前
北京时间今天凌晨 1 点,今年的 Google I/O 2025 开发者大会正式开启。 谷歌最近的大模型技术风头正劲,今年的这场「科技春晚」吸引了全球关注的目光。 没有意外,今年的核心主题自然是 AI。
5/21/2025 9:40:11 AM
机器之心
史上最强AI全家桶!谷歌Gemini 2.5双杀OpenAI,上架250美金天价VIP
谷歌又双叒叕搞事情啦! 昨天,谷歌推出了一款超强的编程智能体Jules,已进入全球测试阶段。 任何拥有Google账户的开发者都可以使用,提供每日5次免费任务。
5/21/2025 9:15:00 AM
解锁 LLM 新高度!一文深度解读 Qwen3 大模型
1、模型架构Qwen3 系列涵盖 6 种密集型模型和 2 种 MoE 模型,参数规模从 0.6 亿到 2350 亿不等,满足不同下游应用需求。 旗舰模型 Qwen3-235B-A22B 作为 MoE 模型,总参数量达 2350 亿,每 token 激活参数量为 220 亿,在性能与效率间取得平衡。 密集型模型Qwen3 的密集型模型架构与 Qwen2.5 类似,采用 Grouped Query Attention(GQA)和 QK-Norm 改进注意力机制,使用 SwiGLU 作为激活函数,搭配 Rotary Positional Embeddings(RoPE)进行位置编码,采用 RMSNorm 并预归一化。
5/21/2025 9:04:38 AM
Goldma
CoT推理大溃败?哈佛华人揭秘:LLM一思考,立刻就「失智」
DeepSeek-R1火了,推理模型火了,思维链(Chain-of-Thought,CoT)火了! 模型很聪明,问题是:它还听你的话吗? 思维链很好,但代价呢?
5/21/2025 9:02:20 AM
百度文心 X1 Turbo 大放异彩,斩获信通院最高评级!
在5月20日举行的百度 AI Day 上,中国信息通信研究院(信通院)公布了最新的大模型推理能力评估结果,令众多科技爱好者为之振奋。 百度的文心大模型 X1Turbo 成为国内首个获得 “4 级” 最高评级的大模型,这一成就让人刮目相看。 此次评估共涵盖24项能力,X1Turbo 在其中表现不凡,16项能力满分达到5分,展示了其强大的技术实力。
5/21/2025 9:01:06 AM
AI在线
谷歌Gemini Live正式登陆iPhone:让AI“看懂”你的屏幕与摄像头!
近日,在2025年 I/O 开发者大会上,谷歌宣布其最新功能 Gemini Live 正式向 iOS 和安卓用户开放。 这项革命性的功能可以实时识别并回应用户手机摄像头和屏幕上的内容,进一步提升了人机交互的体验。 最初,Gemini Live 只面向 Gemini Advanced 高级用户,但谷歌在今年4月宣布计划扩大其覆盖范围,现在,这一功能已经成功引入到 iOS 平台,成为所有用户的新玩具。
5/21/2025 9:01:06 AM
AI在线
面壁智能获新一轮数亿元融资 推动「端侧大脑」规模化应用
面壁智能宣布完成新一轮数亿元融资,本轮融资由洪泰基金、国中资本、清控金信和茅台基金联合投资。 这一融资的完成,将为面壁智能在高效大模型技术、产品壁垒、行业赋能与生态拓展方面奠定坚实基础,推动“端侧大脑”在千行百业的规模化应用。 面壁智能是一家专注于打造高效大模型的公司,以“高效”为第一性原理,致力于在同等参数下实现更高的性能、更低的成本、更低的功耗和更快的速度。
5/21/2025 9:01:06 AM
AI在线
骄傲藏不住!谷歌CEO劈柴哥5.20深夜开大:15项重磅炸弹,两大Gemini前沿方向!中国队Xreal成为谷歌XR原型机代表
编辑 | 云昭北京时间5月21日凌晨1点,谷歌 CEO Sundar Pichai 准点走进坐落于加州山景城的著名露天圆形剧场 Shoreline Amphitheatre,发表了 Google IO 2025 大会的主题演讲。 全程一部定影的时间, 115 分钟,可谓是给 5.20 的深夜奉上了一场别样的谷歌之声。 先说整体感受,整体上如大部分媒体所预料的:Andriod 已经退出焦点,AI 可以说是全部。
5/21/2025 7:45:43 AM
云昭
RAG与微调,大语言模型的“大脑升级”,该选哪条路?(小白科普)
最近在做项目时,我发现有些甲方对RAG和模型微调分区的不太清楚,明明大语言模型(LLM)加挂RAG就可以解决的问题,却坚持要微调,但是具体沟通后发现,其实只是不太了解二者的实际用途。 其实,Retrieval-Augmented Generation (RAG) 和微调 (Fine-Tuning) 是两种最常用的LLM的“大脑升级”技术,虽然它们都能提升模型的性能,但工作原理和适用场景却大相径庭。 今天,我就来深入聊聊这两种技术,弄清楚在不同情况下,到底该选 RAG 还是微调。
5/21/2025 3:00:00 AM
贝塔街的万事屋
谷歌 Meet 视频会议平台将上线 Gemini“AI 同传”,可还原声音、语气、情感
在今日的 I/O 大会上,谷歌宣布将语音翻译功能引入 Meet视频会议平台。该技术借助 Gemini 人工智能,可将用户语音实时翻译成对方所使用的语言。
5/21/2025 1:22:12 AM
清源
蚂蚁武威:下一代「推理」模型范式大猜想
R1 之后,长思维链成为研究下一代基础模型中 “推理”(Reasoning)能力的热门方向。 一方面,R1 证明了大模型深度思考的可行性;与此同时,尽管 R1 展现出了强大的性能,大模型推理的序幕实则才刚刚拉开。 此外,R1 在海外掀桌也给国内人工智能的研究带来一个显著影响,即:越来越多的研究者敢于站在更高视角思考,提出前瞻引领的技术思想。
5/21/2025 12:10:00 AM
陈彩娴
几行代码让自家网站秒变ChatGPT!微软Build上神秘开源协议,掀起第四次计算革命!网友:OpenAI的霸主时代被终结?
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)昨天的微软 Build 2025 开发者大会,用一句话总结就是:信息密度爆表,炸点不断! 如果你是开源党的信徒——这次微软几乎把压箱底的宝贝都掏了出来:GitHub Copilot for VS Code 项目正式开源! 而且直接采用了 MIT 协议,意味着全球开发者不仅能免费访问源码、研究核心逻辑,还能亲自下场参与改进,Copilot 从此变成了真正意义上的“全民AI助手”。
5/20/2025 6:33:37 PM
伊风