OpenAI GPT-6 训练规模将创历史新高：预估 10 万张 H100 GPU，AI 训练成本达天文数字

作者：故渊 2025-03-01 08:39

OpenAI在GPT-4.5介绍视频中意外泄露GPT-6训练可能需要的GPU数量，暗示其规模将远超以往。据悉，GPT-6训练或需10万块H100 GPU，成本达天文数字。#AI训练##OpenAI#

科技媒体 smartprix 昨日（2 月 28 日）发布博文，报道称 OpenAI 在介绍 GPT-4.5 模型的视频中，意外泄露了 GPT-6 训练可能需要的 GPU 数量，暗示其规模将远超以往。

AI在线注：在 GPT-4.5 模型介绍视频的 2 分 26 秒处，OpenAI 展示 GPT 4.5 功能的聊天记录中，出现了“Num GPUs for GPT 6 Training”（训练 GPT-6 所需的 GPU 数量）的字样。

虽然视频中未对此进行任何解释，但“Num”可能暗示了一个前所未有的数字，该媒体推测高达 10 万块 GPU。

OpenAI GPT-6 训练规模将创历史新高：预估 10 万张 H100 GPU，AI 训练成本达天文数字

此前有消息称，OpenAI 在训练 GPT-3 时使用了约 1 万块 GPU，而随着模型的不断迭代，对计算资源的需求也在不断增加。

内部代号为“Orion”的 GPT 4.5 在自然度和减少“幻觉”方面取得了重大进展，其参数量可能超过 3 到 4 万亿。据推测，GPT 4.5 的训练使用了 3 万到 5 万块 NVIDIA H100 GPU，训练成本约 7.5 亿到 15 亿美元（AI在线备注：当前约 54.69 亿到 109.37 亿元人民币）。

截图中“Num”的含义尚不明确，它可能代表“Numerous”（大量），暗示 GPT-6 的训练规模远超以往。当然，这也有可能只是 OpenAI 的一个烟雾弹，就像之前用“Strawberry”（草莓）作为 o1 系列的代号一样。

OpenAI低调更新GPT4o模型，多项能力反超DeepSeek

近日，OpenAI 对其 ChatGPT 的 GPT4o 模型进行了更新，这一消息由 OpenAI 的首席执行官 Sam Altman 在社交平台 X 上透露。 Altman 表示，此次更新是在上个周末进行的，旨在进一步提升用户的使用体验。他强调，新版本的模型在使用过程中表现出色，给用户带来了更为顺畅的体验。

2/18/2025 10:18:00 AM

AI在线

IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线

IBM 近日宣布，其 AI 开发平台 watsonx.ai 现已支持 DeepSeek-R1蒸馏版的 Llama3.18B和 Llama3.370B模型。 DeepSeek 通过知识蒸馏技术，利用 R1模型生成的数据对多个 Llama和 Qwen变体进行了优化，进一步提升了模型性能。在 watsonx.ai平台上，用户可以通过两种方式使用 DeepSeek 蒸馏模型。

2/11/2025 2:25:00 PM

AI在线

DeepSeek-R1 登顶 Hugging Face：以10000 赞力压 150 万个模型

今日凌晨，全球最大开源平台之一 Hugging Face 的首席执行官 Clement Delangue 在社交平台发文宣布，DeepSeek-R1在 Hugging Face 上获得了超过10000个赞，成为该平台近150万个模型中最受欢迎的大模型。这一里程碑式的成就标志着 DeepSeek-R1在全球 AI 社区中的广泛认可与影响力。 DeepSeek-R1的崛起速度令人瞩目。

2/24/2025 9:30:00 AM

AI在线

OpenAI GPT-6 训练规模将创历史新高：预估 10 万张 H100 GPU，AI 训练成本达天文数字

相关资讯

OpenAI低调更新GPT4o模型，多项能力反超DeepSeek

IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线

DeepSeek-R1 登顶 Hugging Face：以10000 赞力压 150 万个模型