ARC-AGI

o3挑战ARC-AGI，遇见大网格就懵圈？英国工程师：ARC-AGI不适合大模型

o3挑战ARC-AGI，遇见大网格就懵圈？英国工程师：ARC-AGI不适合大模型

o3在超难推理任务ARC-AGI上的成绩，属实给人类带来了不少震撼。但有人专门研究了它不会做的题之后，有了更有趣的发现——o3之所以不会做这些题，原因可能不是因为太难，而是题目的规模太大了。来自英国的ML工程师Mikel Bober-Irizar（不妨叫他米哥），对ARC题目进行了细致观察。

12/26/2024 11:42:56 AM

1

资讯热榜

阶跃星辰新一代基础大模型 Step 3 正式开源：拥有强大视觉感知和复杂推理能力多项力压 Grok 4、OpenAI o3，谷歌推出 Gemini 2.5 Deep Think 模型 OpenAI 被曝向搜索引擎公开 ChatGPT 共享对话内容，后因隐私风险叫停马斯克、吴恩达青睐，黄仁勋批评，见证百度、OpenAI内部起落，Anthropic CEO自曝式采访：诞生四年，每年营收十倍增长 OpenAI回应ChatGPT用多了会变傻保姆级教程！总结AI产品的5种界面布局设计 DeepSeek 下一代技术提前曝光，梁文锋署名论文获 ACL 2025 最佳论文奖 OpenAI首席科学家访谈被紧急制止！有些名字现在不让说了……

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌机器人数据大模型 Midjourney 开源智能用户 Meta 微软 GPT 学习技术图像 Gemini AI创作马斯克论文智能体英伟达 Anthropic 代码算法训练 Stable Diffusion 芯片开发者蛋白质腾讯 LLM 生成式苹果 Claude 神经网络 Agent AI新词 3D 机器学习 AI for Science 研究生成 xAI 人形机器人 AI视频计算 Sora GPU AI设计百度华为工具搜索大语言模型具身智能场景 RAG 字节跳动大型语言模型预测深度学习伟达视觉 Transformer AGI 视频生成神器推荐亚马逊架构 Copilot DeepMind 模态安全