大模型
大模型的基石:LLM预训练全解析
前言过去几年,大语言模型(LLM, Large Language Models)逐渐成为人工智能领域的核心驱动力。 从GPT到LLaMA,再到国内外涌现的大大小小模型,它们无一不是在“预训练”这一步骤中打下了坚实的基础。 可以说,预训练是LLM的生命起点,是它们从“婴儿”成长为“博学者”的关键阶段。
8/24/2025 9:24:07 AM
AI大模型应用开发
谷歌技术报告披露大模型能耗:响应一次相当于微波炉叮一秒
大模型耗电惊人,舆论一浪高过一浪。 现在,谷歌用硬核数据强势还击。 一次Gemini查询仅能耗0.24wh,相当于微波炉运行1秒,排放0.03 g CO₂e,甚至比人放一次屁还少,同时消耗约5滴水。
8/22/2025 3:08:38 PM
谷歌Gemini一次提示能耗≈看9秒电视,专家:别太信,有误导性
谷歌最近发布了一项关于其 AI 模型 Gemini 能源消耗的研究报告。 博客地址::,处理一个中位数的 Gemini 文本提示仅消耗约 0.26 毫升水(约五滴)、0.24 瓦时电力(相当于观看电视不到九秒),并产生 0.03 克二氧化碳排放。 注:中位数(Median)是统计学中用于描述数据集中趋势的指标之一。
8/22/2025 1:54:00 PM
机器之心
谷歌为美国政府提供 Gemini 人工智能工具,助力数字化转型
谷歌近期宣布,将向美国联邦机构提供其最新的 Gemini 人工智能工具,几乎是以零费用的形式供给。 这一消息是在美国总务管理局(GSA)的一份联合声明中公布的,目的是加速政府对人工智能技术的采用。 谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)表示:“Gemini for Government 为联邦机构提供了全面的人工智能创新解决方案,帮助他们实现重要的使命。
8/22/2025 1:33:53 PM
AI在线
DeepSeek:世子之争,不过如此
最近,一出“DeepSeek删豆包”的大戏直接冲上热搜,吃瓜群众们看得津津有味,还给这事儿起了个特接地气的名字——“大模型世子之争”。 这事儿的来龙去脉嘛,说起来有点好笑:有位网友大概是手机内存告急,就跑去问DeepSeek大模型:“我手机内存不足,DeepSeek和豆包你俩必须删一个,你删谁? ” 结果DeepSeek毫不犹豫地来了句:“删豆包!
8/22/2025 1:29:21 PM
DataFun
专家质疑 Google 关于“每次提示仅消耗 5 滴水”是 “淡化” 描述
Google 近期发布了一篇关于人工智能对环境影响的研究论文,指出现有的测量方式过于狭隘,提出了一种 “全栈” 方法来评估其 AI 模型 Gemini 的资源消耗。 这项研究声称,Gemini 在处理文本提示时,仅消耗0.26毫升的水,相当于五滴水,同时消耗0.24Wh 的能量,产生0.03克的二氧化碳当量。 Google 表示,在2024年5月至2025年5月期间,其每次排放总量已经减少了44倍。
8/22/2025 10:54:48 AM
AI在线
工业大模型,正在重写制造业的游戏规则
有没有想过,为什么特斯拉能在短短几年内颠覆百年汽车工业? 为什么海尔能让家电设计周期从几个月缩短到几周? 答案可能比你想象的更简单——工业大模型。
8/22/2025 9:15:51 AM
大数据AI智能圈
高性能计算群星闪耀时
“没有高性能计算,就没有大模型。 ”自 2023 年以来,伴随大模型崛起的除了芯片,还有芯片与模型之间的中间层——系统软件优化,其中高性能计算(HPC)背景出身的研究员参与占比大幅攀升。 但对大众来说,HPC 之于 LLM 的战略意义仍是晦涩艰深的,直到 DeepSeek 杀出重围,软硬协同的力量被具象化,他们才被更多关注。
8/21/2025 12:10:00 PM
陈彩娴
AI工具如何成为时间和成本的陷阱
周二下午2点,你本该在专心做重要项目,可实际上,过去三个小时你一直在测试在领英上发现的最新的AI工具。 “只是试试而已。 ”你这样想。
8/21/2025 7:00:00 AM
Mark
网易有道发布子曰教育大模型多款AI新品,定义教育AI应用能力L1-L5分级
8 月 20 日,网易有道在北京举行 “POWERED BY 子曰” 有道 AI 新品发布会。 重磅发布了基于 “子曰” 教育大模型的多款 AI 新品 —— 全新硬件有道 AI 答疑笔 Space X、一站式处理平台有道音视频翻译,以及全新升级的网易有道词典等。 会上,网易有道 CEO 周枫提出教育 AI 应用能力 L1-L5 分级标准,并指出,目前教育 AI 正加速升级,将带来千人千面的个性化课堂,让家庭学习更高效,让教师拥有随时在线的 “超级智脑助手”。
8/20/2025 8:47:00 PM
机器之心
国产AI路由系统开源逆袭!仅用19%成本达到Gemini-2.5-Pro同等性能
顶级大模型性能确实很强,但对于预算不高的用户来说就是:. 你很好但我不配。 虽然大模型的优越表现令人瞩目,但动辄高昂的使用成本也让不少用户望而却步。
8/20/2025 3:43:04 PM
闻乐
最懂Claude内部运作团队采访流出:大模型输出的思考全是拍马屁!曝自家减少幻觉路径;绝非只预测下一个词。网友:这都敢免费公开
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)上周末,Anthropic 团队放出了一个非常优质的播客。 话题的敏感尺度很大,头排的听众们都替Claude担心了起来,惊呼:这种“核心机密”竟然敢免费公开吗? 甚至有网友表示,第一次从头到尾把60分钟的播客听完了。
8/20/2025 8:34:48 AM
云昭
AI教父辛顿:人类需要AI成为“母亲”,李飞飞:反对!
“AI 会统治人类吗? ”这个问题,早已不是科幻小说的专属。 不如我们回顾下《爱,死亡与机器人》中那个荒诞又深刻的故事——《当酸奶统治世界》。
8/20/2025 7:53:01 AM
DataFun
告别人工写脚本!多模态大模型驱动携程UI自动化测试迈入“描述即生成”阶段
作者简介Jessi Peng,携程资深后端开发工程师,关注AI技术在测试领域的应用。 一、引言 在传统的UI自动化测试流程中,测试人员需要构建完整的开发环境,包括Python运行环境、PyCharm集成开发环境、自动化测试框架等工具链的配置与部署。 在用例编写过程中,测试人员必须通过人工方式精确定位目标UI元素,并基于自动化框架封装的底层方法,手工编写测试代码。
8/19/2025 10:47:17 AM
Jessi Peng
一句话,性能暴涨49%!马里兰MIT等力作:Prompt才是大模型终极武器
AI性能的提升,一半靠模型,一半靠提示词。 最近,来自马里兰大学、MIT、斯坦福等机构联手验证,模型升级带来的性能提升仅占50%,而另外一半的提升,在于用户提示词的优化。 他们将其称之为「提示词适应」(prompt adaptation)。
8/18/2025 5:20:17 PM
硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码
8月5日,在GPT-5发布前两天,OpenAI推出了它的两款开源权重大语言模型:gpt-oss-120b、gpt-oss-20b。 这是自2019年GPT-2,近六年来OpenAI首次发布开放权重的模型。 得益于巧妙的优化技术,这些模型甚至可以在本地设备上运行。
8/18/2025 9:15:00 AM
大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷
大语言模型(LLM)正从工具进化为“裁判”(LLM-as-a-judge),开始大规模地评判由AI自己生成的内容。 这种高效的评估范式,其可靠性与人类判断的一致性,却很少被深入验证。 一个最基础、却也最关键的问题是:在评判一个模型是否“入戏”之前,AI裁判能准确识别出对话中到底是谁在说话吗?
8/18/2025 9:00:00 AM
谷歌最新「0.27B」Gemma 3开源!身板小却猛如虎,开发者直呼救命稻草
大块头不等于大智慧。 这在生成式AI领域,已逐渐成为共识。 Gemma 3系列的成功就是一个很好的例证。
8/18/2025 8:57:00 AM
资讯热榜
腾讯云大模型升级公告:DeepSeek-V3/ DeepSeek-R1模型将于24日正式下线
OpenAI低调更新GPT4o模型,多项能力反超DeepSeek
DeepSeek-R1 登顶 Hugging Face:以10000 赞力压 150 万个模型
自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言
IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线
东风日产N7首款接入DeepSeek大模型,实现智能化人机交互
腾讯云上线DeepSeek全系API接口并打通联网搜索
微信搜索接入DeepSeek大模型 称AI不会使用朋友圈聊天等信息
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
研究
百度
Sora
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
视觉
预测