大型推理模型

苹果研究揭示AI“假性思考”真相:推理模型在复杂任务下反而崩溃

苹果研究揭示AI“假性思考”真相:推理模型在复杂任务下反而崩溃

一项由苹果研究人员主导的新研究，对当前被寄予厚望的大型推理模型（LRM）泼了一盆冷水。研究发现，在解决复杂任务时，像 Claude3.7Thinking 和 Deepseek-R1等专为“模拟思维过程”设计的推理模型，不仅未能展现出优势，反而出现“思考不足”、性能崩溃等严重问题。这项研究测试了四种经典逻辑谜题:汉诺塔、跳棋、渡河与积木世界。

6/9/2025 10:00:56 AM

AI在线

1

资讯热榜

6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享 AI玩拼图游戏暴涨视觉理解力，告别文本中心训练，无需标注的多模态大模型后训练范式 OpenAI 为 ChatGPT 推出智能记忆清理功能，Plus 用户率先体验大模型降本增效，稀疏注意力机制的魔力在哪？ AI音乐创作成程序员新副业：单曲播放破200万，版权收入数万元实测，Claude Code 配合国内大模型，一样很牛x（完整配置教程）英国政府提出 AI 节省 450 亿英镑计划，但专家质疑其可行性 Claude 与 Microsoft 365 深度整合，企业效率再提升！

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画机器人数据大模型 Midjourney 开源 Meta 智能微软用户 AI新词 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练论文 LLM 代码算法芯片 Stable Diffusion 苹果腾讯 AI for Science Agent Claude 蛋白质开发者生成式神经网络 xAI 机器学习 3D 人形机器人研究生成 AI视频百度大语言模型具身智能 Sora 工具 GPU RAG 华为计算字节跳动 AI设计搜索 AGI 大型语言模型场景视频生成深度学习架构 DeepMind 视觉预测 Transformer 伟达编程 AI模型生成式AI 特斯拉神器推荐