大语言

美国奥数题撕碎AI数学神话，顶级模型现场翻车！最高得分5%，DeepSeek唯一逆袭

美国奥数题撕碎AI数学神话，顶级模型现场翻车！最高得分5%，DeepSeek唯一逆袭

3月26号，ETH等团队的一项研究一经发布，就引起了圈内热议。这项研究彻底撕开遮羞布，直接击碎了「LLM会做数学题」这个神话！论文地址：，MathArena团队使用最近的2025年美国数学奥林匹克竞赛进行了详细评估，结果令人大吃一惊——所有大模型的得分，都低于5%！

4/3/2025 2:25:00 AM

新智元

1

资讯热榜

OpenAI更新ChatGPT规则：10月29日起禁止医疗、法律与财务建议 Reddit CEO直言：AI聊天机器人并未带来流量红利，搜索仍是核心引擎 eBay携手ChatGPT开启智能电商新时代，购物体验将全面升级！从AI到泰勒·斯威夫特——源于生活的案例与启示 OpenAI 开放 Sora2视频工具，面向美国、加拿大、日本和韩国用户看完刘润年度演讲，教你做好AI时代的能力迁徙！ OpenAI年收入已远超130亿美元，上市计划仍遥遥无期库克:苹果将在人工智能领域寻求更多收购与合作机会

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画大模型机器人数据 Midjourney 开源 Meta AI新词微软智能用户 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练 LLM 论文代码算法 Agent AI for Science 芯片苹果 Claude 腾讯 Stable Diffusion 蛋白质开发者生成式神经网络 xAI 机器学习 3D RAG 人形机器人 AI视频研究大语言模型具身智能生成百度 Sora 工具 GPU 华为计算字节跳动 AI设计大型语言模型 AGI 搜索视频生成场景深度学习架构生成式AI DeepMind 编程亚马逊视觉 Transformer AI模型预测特斯拉 MCP