大模型

大模型的基石：LLM预训练全解析

前言过去几年，大语言模型（LLM, Large Language Models）逐渐成为人工智能领域的核心驱动力。从GPT到LLaMA，再到国内外涌现的大大小小模型，它们无一不是在“预训练”这一步骤中打下了坚实的基础。可以说，预训练是LLM的生命起点，是它们从“婴儿”成长为“博学者”的关键阶段。

8/24/2025 9:24:07 AM

AI大模型应用开发

谷歌技术报告披露大模型能耗：响应一次相当于微波炉叮一秒

大模型耗电惊人，舆论一浪高过一浪。现在，谷歌用硬核数据强势还击。一次Gemini查询仅能耗0.24wh，相当于微波炉运行1秒，排放0.03 g CO₂e，甚至比人放一次屁还少，同时消耗约5滴水。

8/22/2025 3:08:38 PM

谷歌Gemini一次提示能耗≈看9秒电视，专家：别太信，有误导性

谷歌最近发布了一项关于其 AI 模型 Gemini 能源消耗的研究报告。博客地址：：，处理一个中位数的 Gemini 文本提示仅消耗约 0.26 毫升水（约五滴）、0.24 瓦时电力（相当于观看电视不到九秒），并产生 0.03 克二氧化碳排放。注：中位数（Median）是统计学中用于描述数据集中趋势的指标之一。

8/22/2025 1:54:00 PM

机器之心

谷歌为美国政府提供 Gemini 人工智能工具，助力数字化转型

谷歌近期宣布，将向美国联邦机构提供其最新的 Gemini 人工智能工具，几乎是以零费用的形式供给。这一消息是在美国总务管理局（GSA）的一份联合声明中公布的，目的是加速政府对人工智能技术的采用。谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)表示:“Gemini for Government 为联邦机构提供了全面的人工智能创新解决方案，帮助他们实现重要的使命。

8/22/2025 1:33:53 PM

AI在线

DeepSeek：世子之争，不过如此

最近，一出“DeepSeek删豆包”的大戏直接冲上热搜，吃瓜群众们看得津津有味，还给这事儿起了个特接地气的名字——“大模型世子之争”。这事儿的来龙去脉嘛，说起来有点好笑：有位网友大概是手机内存告急，就跑去问DeepSeek大模型：“我手机内存不足，DeepSeek和豆包你俩必须删一个，你删谁？ ” 结果DeepSeek毫不犹豫地来了句：“删豆包！

8/22/2025 1:29:21 PM

DataFun

专家质疑 Google 关于“每次提示仅消耗 5 滴水”是 “淡化” 描述

Google 近期发布了一篇关于人工智能对环境影响的研究论文，指出现有的测量方式过于狭隘，提出了一种 “全栈” 方法来评估其 AI 模型 Gemini 的资源消耗。这项研究声称，Gemini 在处理文本提示时，仅消耗0.26毫升的水，相当于五滴水，同时消耗0.24Wh 的能量，产生0.03克的二氧化碳当量。 Google 表示，在2024年5月至2025年5月期间，其每次排放总量已经减少了44倍。

8/22/2025 10:54:48 AM

AI在线

工业大模型，正在重写制造业的游戏规则

有没有想过，为什么特斯拉能在短短几年内颠覆百年汽车工业？为什么海尔能让家电设计周期从几个月缩短到几周？答案可能比你想象的更简单——工业大模型。

8/22/2025 9:15:51 AM

大数据AI智能圈

高性能计算群星闪耀时

“没有高性能计算，就没有大模型。 ”自 2023 年以来，伴随大模型崛起的除了芯片，还有芯片与模型之间的中间层——系统软件优化，其中高性能计算（HPC）背景出身的研究员参与占比大幅攀升。但对大众来说，HPC 之于 LLM 的战略意义仍是晦涩艰深的，直到 DeepSeek 杀出重围，软硬协同的力量被具象化，他们才被更多关注。

8/21/2025 12:10:00 PM

陈彩娴

AI工具如何成为时间和成本的陷阱

周二下午2点，你本该在专心做重要项目，可实际上，过去三个小时你一直在测试在领英上发现的最新的AI工具。 “只是试试而已。 ”你这样想。

8/21/2025 7:00:00 AM

Mark

网易有道发布子曰教育大模型多款AI新品，定义教育AI应用能力L1-L5分级

8 月 20 日，网易有道在北京举行 “POWERED BY 子曰” 有道 AI 新品发布会。重磅发布了基于 “子曰” 教育大模型的多款 AI 新品 —— 全新硬件有道 AI 答疑笔 Space X、一站式处理平台有道音视频翻译，以及全新升级的网易有道词典等。会上，网易有道 CEO 周枫提出教育 AI 应用能力 L1-L5 分级标准，并指出，目前教育 AI 正加速升级，将带来千人千面的个性化课堂，让家庭学习更高效，让教师拥有随时在线的 “超级智脑助手”。

8/20/2025 8:47:00 PM

机器之心

国产AI路由系统开源逆袭！仅用19%成本达到Gemini-2.5-Pro同等性能

顶级大模型性能确实很强，但对于预算不高的用户来说就是：. 你很好但我不配。虽然大模型的优越表现令人瞩目，但动辄高昂的使用成本也让不少用户望而却步。

8/20/2025 3:43:04 PM

闻乐

最懂Claude内部运作团队采访流出：大模型输出的思考全是拍马屁！曝自家减少幻觉路径；绝非只预测下一个词。网友：这都敢免费公开

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）上周末，Anthropic 团队放出了一个非常优质的播客。话题的敏感尺度很大，头排的听众们都替Claude担心了起来，惊呼：这种“核心机密”竟然敢免费公开吗？甚至有网友表示，第一次从头到尾把60分钟的播客听完了。

8/20/2025 8:34:48 AM

云昭

AI教父辛顿：人类需要AI成为“母亲”，李飞飞：反对！

“AI 会统治人类吗？ ”这个问题，早已不是科幻小说的专属。不如我们回顾下《爱，死亡与机器人》中那个荒诞又深刻的故事——《当酸奶统治世界》。

8/20/2025 7:53:01 AM

DataFun

告别人工写脚本！多模态大模型驱动携程UI自动化测试迈入“描述即生成”阶段

作者简介Jessi Peng，携程资深后端开发工程师，关注AI技术在测试领域的应用。一、引言在传统的UI自动化测试流程中，测试人员需要构建完整的开发环境，包括Python运行环境、PyCharm集成开发环境、自动化测试框架等工具链的配置与部署。在用例编写过程中，测试人员必须通过人工方式精确定位目标UI元素，并基于自动化框架封装的底层方法，手工编写测试代码。

8/19/2025 10:47:17 AM

Jessi Peng

资讯热榜

腾讯云大模型升级公告:DeepSeek-V3/ DeepSeek-R1模型将于24日正式下线 OpenAI低调更新GPT4o模型，多项能力反超DeepSeek DeepSeek-R1 登顶 Hugging Face：以10000 赞力压 150 万个模型自有歪果仁为DeepSeek「辩经」：揭穿围绕DeepSeek的谣言 IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线东风日产N7首款接入DeepSeek大模型，实现智能化人机交互腾讯云上线DeepSeek全系API接口并打通联网搜索微信搜索接入DeepSeek大模型称AI不会使用朋友圈聊天等信息

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习技术智能体 Gemini 马斯克 Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型研究百度 Sora 生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 特斯拉场景 AI模型深度学习亚马逊架构 Transformer MCP 编程视觉预测

大模型

大模型的基石：LLM预训练全解析

谷歌技术报告披露大模型能耗：响应一次相当于微波炉叮一秒

谷歌Gemini一次提示能耗≈看9秒电视，专家：别太信，有误导性

谷歌为美国政府提供 Gemini 人工智能工具，助力数字化转型

DeepSeek：世子之争，不过如此

专家质疑 Google 关于“每次提示仅消耗 5 滴水”是 “淡化” 描述

工业大模型，正在重写制造业的游戏规则

高性能计算群星闪耀时

AI工具如何成为时间和成本的陷阱

网易有道发布子曰教育大模型多款AI新品，定义教育AI应用能力L1-L5分级

国产AI路由系统开源逆袭！仅用19%成本达到Gemini-2.5-Pro同等性能

最懂Claude内部运作团队采访流出：大模型输出的思考全是拍马屁！曝自家减少幻觉路径；绝非只预测下一个词。网友：这都敢免费公开

AI教父辛顿：人类需要AI成为“母亲”，李飞飞：反对！

告别人工写脚本！多模态大模型驱动携程UI自动化测试迈入“描述即生成”阶段

一句话，性能暴涨49%！马里兰MIT等力作：Prompt才是大模型终极武器

硬核拆解！从GPT-2到gpt-oss，揭秘大模型进化关键密码

大模型给自己当裁判并不靠谱！上海交通大学新研究揭示LLM-as-a-judge机制缺陷

谷歌最新「0.27B」Gemma 3开源！身板小却猛如虎，开发者直呼救命稻草

大模型

大模型的基石：LLM预训练全解析

谷歌技术报告披露大模型能耗：响应一次相当于微波炉叮一秒

谷歌Gemini一次提示能耗≈看9秒电视，专家：别太信，有误导性

​谷歌为美国政府提供 Gemini 人工智能工具，助力数字化转型

DeepSeek：世子之争，不过如此

专家质疑 Google 关于“每次提示仅消耗 5 滴水”是 “淡化” 描述

工业大模型，正在重写制造业的游戏规则

高性能计算群星闪耀时

AI工具如何成为时间和成本的陷阱

网易有道发布子曰教育大模型多款AI新品，定义教育AI应用能力L1-L5分级

国产AI路由系统开源逆袭！仅用19%成本达到Gemini-2.5-Pro同等性能

最懂Claude内部运作团队采访流出：大模型输出的思考全是拍马屁！曝自家减少幻觉路径；绝非只预测下一个词。网友：这都敢免费公开

AI教父辛顿：人类需要AI成为“母亲”，李飞飞：反对！

告别人工写脚本！多模态大模型驱动携程UI自动化测试迈入“描述即生成”阶段

一句话，性能暴涨49%！马里兰MIT等力作：Prompt才是大模型终极武器

硬核拆解！从GPT-2到gpt-oss，揭秘大模型进化关键密码

大模型给自己当裁判并不靠谱！上海交通大学新研究揭示LLM-as-a-judge机制缺陷

谷歌最新「0.27B」Gemma 3开源！身板小却猛如虎，开发者直呼救命稻草

谷歌为美国政府提供 Gemini 人工智能工具，助力数字化转型