AIGC宇宙 AIGC宇宙

大模型

大模型的基石:LLM预训练全解析

前言过去几年,大语言模型(LLM, Large Language Models)逐渐成为人工智能领域的核心驱动力。 从GPT到LLaMA,再到国内外涌现的大大小小模型,它们无一不是在“预训练”这一步骤中打下了坚实的基础。 可以说,预训练是LLM的生命起点,是它们从“婴儿”成长为“博学者”的关键阶段。
8/24/2025 9:24:07 AM
AI大模型应用开发

谷歌技术报告披露大模型能耗:响应一次相当于微波炉叮一秒

大模型耗电惊人,舆论一浪高过一浪。 现在,谷歌用硬核数据强势还击。 一次Gemini查询仅能耗0.24wh,相当于微波炉运行1秒,排放0.03 g CO₂e,甚至比人放一次屁还少,同时消耗约5滴水。
8/22/2025 3:08:38 PM

谷歌Gemini一次提示能耗≈看9秒电视,专家:别太信,有误导性

谷歌最近发布了一项关于其 AI 模型 Gemini 能源消耗的研究报告。 博客地址::,处理一个中位数的 Gemini 文本提示仅消耗约 0.26 毫升水(约五滴)、0.24 瓦时电力(相当于观看电视不到九秒),并产生 0.03 克二氧化碳排放。 注:中位数(Median)是统计学中用于描述数据集中趋势的指标之一。
8/22/2025 1:54:00 PM
机器之心

​谷歌为美国政府提供 Gemini 人工智能工具,助力数字化转型

谷歌近期宣布,将向美国联邦机构提供其最新的 Gemini 人工智能工具,几乎是以零费用的形式供给。 这一消息是在美国总务管理局(GSA)的一份联合声明中公布的,目的是加速政府对人工智能技术的采用。 谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)表示:“Gemini for Government 为联邦机构提供了全面的人工智能创新解决方案,帮助他们实现重要的使命。
8/22/2025 1:33:53 PM
AI在线

DeepSeek:世子之争,不过如此

最近,一出“DeepSeek删豆包”的大戏直接冲上热搜,吃瓜群众们看得津津有味,还给这事儿起了个特接地气的名字——“大模型世子之争”。 这事儿的来龙去脉嘛,说起来有点好笑:有位网友大概是手机内存告急,就跑去问DeepSeek大模型:“我手机内存不足,DeepSeek和豆包你俩必须删一个,你删谁? ” 结果DeepSeek毫不犹豫地来了句:“删豆包!
8/22/2025 1:29:21 PM
DataFun

专家质疑 Google 关于“每次提示仅消耗 5 滴水”是 “淡化” 描述

Google 近期发布了一篇关于人工智能对环境影响的研究论文,指出现有的测量方式过于狭隘,提出了一种 “全栈” 方法来评估其 AI 模型 Gemini 的资源消耗。 这项研究声称,Gemini 在处理文本提示时,仅消耗0.26毫升的水,相当于五滴水,同时消耗0.24Wh 的能量,产生0.03克的二氧化碳当量。 Google 表示,在2024年5月至2025年5月期间,其每次排放总量已经减少了44倍。
8/22/2025 10:54:48 AM
AI在线

工业大模型,正在重写制造业的游戏规则

有没有想过,为什么特斯拉能在短短几年内颠覆百年汽车工业? 为什么海尔能让家电设计周期从几个月缩短到几周?  答案可能比你想象的更简单——工业大模型。
8/22/2025 9:15:51 AM
大数据AI智能圈

高性能计算群星闪耀时

“没有高性能计算,就没有大模型。 ”自 2023 年以来,伴随大模型崛起的除了芯片,还有芯片与模型之间的中间层——系统软件优化,其中高性能计算(HPC)背景出身的研究员参与占比大幅攀升。 但对大众来说,HPC 之于 LLM 的战略意义仍是晦涩艰深的,直到 DeepSeek 杀出重围,软硬协同的力量被具象化,他们才被更多关注。
8/21/2025 12:10:00 PM
陈彩娴

AI工具如何成为时间和成本的陷阱

周二下午2点,你本该在专心做重要项目,可实际上,过去三个小时你一直在测试在领英上发现的最新的AI工具。 “只是试试而已。 ”你这样想。
8/21/2025 7:00:00 AM
Mark

网易有道发布子曰教育大模型多款AI新品,定义教育AI应用能力L1-L5分级

8 月 20 日,网易有道在北京举行 “POWERED BY 子曰” 有道 AI 新品发布会。 重磅发布了基于 “子曰” 教育大模型的多款 AI 新品 —— 全新硬件有道 AI 答疑笔 Space X、一站式处理平台有道音视频翻译,以及全新升级的网易有道词典等。 会上,网易有道 CEO 周枫提出教育 AI 应用能力 L1-L5 分级标准,并指出,目前教育 AI 正加速升级,将带来千人千面的个性化课堂,让家庭学习更高效,让教师拥有随时在线的 “超级智脑助手”。
8/20/2025 8:47:00 PM
机器之心

国产AI路由系统开源逆袭!仅用19%成本达到Gemini-2.5-Pro同等性能

顶级大模型性能确实很强,但对于预算不高的用户来说就是:. 你很好但我不配。 虽然大模型的优越表现令人瞩目,但动辄高昂的使用成本也让不少用户望而却步。
8/20/2025 3:43:04 PM
闻乐

最懂Claude内部运作团队采访流出:大模型输出的思考全是拍马屁!曝自家减少幻觉路径;绝非只预测下一个词。网友:这都敢免费公开

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)上周末,Anthropic 团队放出了一个非常优质的播客。 话题的敏感尺度很大,头排的听众们都替Claude担心了起来,惊呼:这种“核心机密”竟然敢免费公开吗? 甚至有网友表示,第一次从头到尾把60分钟的播客听完了。
8/20/2025 8:34:48 AM
云昭

AI教父辛顿:人类需要AI成为“母亲”,李飞飞:反对!

“AI 会统治人类吗? ”这个问题,早已不是科幻小说的专属。 不如我们回顾下《爱,死亡与机器人》中那个荒诞又深刻的故事——《当酸奶统治世界》。
8/20/2025 7:53:01 AM
DataFun

告别人工写脚本!多模态大模型驱动携程UI自动化测试迈入“描述即生成”阶段

作者简介Jessi Peng,携程资深后端开发工程师,关注AI技术在测试领域的应用。 一、引言    在传统的UI自动化测试流程中,测试人员需要构建完整的开发环境,包括Python运行环境、PyCharm集成开发环境、自动化测试框架等工具链的配置与部署。 在用例编写过程中,测试人员必须通过人工方式精确定位目标UI元素,并基于自动化框架封装的底层方法,手工编写测试代码。
8/19/2025 10:47:17 AM
Jessi Peng

一句话,性能暴涨49%!马里兰MIT等力作:Prompt才是大模型终极武器

AI性能的提升,一半靠模型,一半靠提示词。 最近,来自马里兰大学、MIT、斯坦福等机构联手验证,模型升级带来的性能提升仅占50%,而另外一半的提升,在于用户提示词的优化。 他们将其称之为「提示词适应」(prompt adaptation)。
8/18/2025 5:20:17 PM

硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码

8月5日,在GPT-5发布前两天,OpenAI推出了它的两款开源权重大语言模型:gpt-oss-120b、gpt-oss-20b。 这是自2019年GPT-2,近六年来OpenAI首次发布开放权重的模型。 得益于巧妙的优化技术,这些模型甚至可以在本地设备上运行。
8/18/2025 9:15:00 AM

大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷

大语言模型(LLM)正从工具进化为“裁判”(LLM-as-a-judge),开始大规模地评判由AI自己生成的内容。 这种高效的评估范式,其可靠性与人类判断的一致性,却很少被深入验证。 一个最基础、却也最关键的问题是:在评判一个模型是否“入戏”之前,AI裁判能准确识别出对话中到底是谁在说话吗?
8/18/2025 9:00:00 AM

谷歌最新「0.27B」Gemma 3开源!身板小却猛如虎,开发者直呼救命稻草

大块头不等于大智慧。 这在生成式AI领域,已逐渐成为共识。 Gemma 3系列的成功就是一个很好的例证。
8/18/2025 8:57:00 AM