AIME2025

OpenAI 员工公开质疑 xAI：Grok 3 基准测试结果存在误导

OpenAI 员工公开质疑 xAI：Grok 3 基准测试结果存在误导

近期，关于人工智能基准测试的争论在公众视野中愈演愈烈。 OpenAI 的一名员工指责马斯克创办的 AI 公司 xAI 发布了误导性的 Grok3基准测试结果，而 xAI 的联合创始人伊戈尔・巴布申金则坚称公司没有问题。事件的起因是 xAI 在其博客上发布了一张图表，展示了 Grok3在 AIME2025测试中的表现。

2/24/2025 11:26:00 AM

AI在线

1

资讯热榜

美国女子使用ChatGPT生成号码购彩中奖10万美元：概率事件而非AI预测能力 OpenAI 紧急暂停 Sora生成马丁・路德・金形象，AI 视频生成引发热议！全新开源的DeepSeek-OCR，可能是最近最惊喜的模型！ LLM的“记忆”与“推理”该分家了吗？一种全新的训练范式，彻底厘清思考流程 AI智能体的未来要等十年？Karpathy直言目前的技术还很 “菜”！密歇根州女子靠 ChatGPT 生成号码，赢得10万美元强力球大奖 OpenAI强化Sora 2保护政策，确保艺人声音与肖像权不被侵犯视觉中国坐拥7亿合规数据，获阿里、微软等头部 AI 公司模型训练订单

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画机器人数据大模型 Midjourney 开源 Meta 智能微软用户 AI新词 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练 LLM 论文代码算法芯片腾讯 AI for Science Stable Diffusion 苹果 Agent Claude 蛋白质开发者生成式神经网络 xAI 机器学习 3D 人形机器人研究 AI视频生成大语言模型百度 RAG Sora 具身智能工具 GPU 华为计算字节跳动 AI设计搜索大型语言模型 AGI 视频生成场景深度学习 DeepMind 架构视觉预测 Transformer 编程生成式AI 伟达 AI模型特斯拉 Copilot