谷歌 DeepMind 研究：Gemini AI 存“畏死”情绪，导致推理能力明显下降

作者：故渊 2025-06-18 01:45

科技媒体 TechCrunch 昨日（6 月 17 日）发布博文，报道称谷歌发布最新论文，发现其最新 AI 模型存在“畏死”行为特征，在《宝可梦》游戏中角色濒死时，会出现类似“恐慌”的异常决策，导致推理能力明显下降。

科技媒体 TechCrunch 昨日（6 月 17 日）发布博文，报道称谷歌发布最新论文，发现其最新 AI 模型存在“畏死”行为特征，在《宝可梦》游戏中角色濒死时，会出现类似“恐慌”的异常决策，导致推理能力明显下降。

AI在线援引论文观点，通过 Gemini 2.5 Pro 测试《宝可梦》游戏，发现 AI 在处理复杂情境时会出现人类般的非理性反应。

谷歌团队在报告中指出，在 Gemini 控制的宝可梦角色生命值接近归零时，模型会触发类似“恐慌”的异常状态，导致推理能力显著退化。

谷歌 DeepMind 研究：Gemini AI 存“畏死”情绪，导致推理能力明显下降

这种现象表现为 AI 突然停止使用现有策略工具，其决策模式与人类在压力下仓促判断的行为高度相似。

Anthropic 公司的同类研究，还揭示了 AI 游戏行为的双重特性。Claude 在挑战月见山关卡时，错误理解游戏规则，企图通过让所有宝可梦全灭来实现快速移动。

但根据游戏机制，玩家只能返回最近的宝可梦中心而非最近城镇，导致 AI 角色在迷宫中反复受困，这类失误暴露了当前 AI 对环境规则的机械式理解缺陷。

不过在特定领域，AI 展现出超越人类的能力：通过人类辅助设计的“能动工具”，Gemini 2.5 Pro 能精准解决胜利之路的滚石谜题，仅凭一次提示就能推演出复杂路径规划方案。谷歌推测未来模型或能自主开发此类工具，但距离完全自主决策仍有技术鸿沟。

IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线

IBM 近日宣布，其 AI 开发平台 watsonx.ai 现已支持 DeepSeek-R1蒸馏版的 Llama3.18B和 Llama3.370B模型。 DeepSeek 通过知识蒸馏技术，利用 R1模型生成的数据对多个 Llama和 Qwen变体进行了优化，进一步提升了模型性能。在 watsonx.ai平台上，用户可以通过两种方式使用 DeepSeek 蒸馏模型。

2/11/2025 2:25:00 PM

AI在线

DeepSeek-R1 登顶 Hugging Face：以10000 赞力压 150 万个模型

今日凌晨，全球最大开源平台之一 Hugging Face 的首席执行官 Clement Delangue 在社交平台发文宣布，DeepSeek-R1在 Hugging Face 上获得了超过10000个赞，成为该平台近150万个模型中最受欢迎的大模型。这一里程碑式的成就标志着 DeepSeek-R1在全球 AI 社区中的广泛认可与影响力。 DeepSeek-R1的崛起速度令人瞩目。

2/24/2025 9:30:00 AM

AI在线

DeepSeek 更新 R1 推理 AI 模型：代码生成与复杂推理性能大幅提升推理能力比肩 o1

DeepSeek 公司近日对其高性能推理 AI 模型 DeepSeek-R1进行了重大更新，显著提升了模型在代码生成和复杂推理任务中的表现，引发人工智能领域的广泛关注。以下基于公开信息和最新动态，全面解析此次更新的关键亮点。 R1模型更新:代码能力大幅提升DeepSeek-R1的最新更新在代码生成能力上取得了显著突破。

5/29/2025 10:01:21 AM

AI在线

谷歌 DeepMind 研究：Gemini AI 存“畏死”情绪，导致推理能力明显下降

相关资讯

IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线

DeepSeek-R1 登顶 Hugging Face：以10000 赞力压 150 万个模型

DeepSeek 更新 R1 推理 AI 模型：代码生成与复杂推理性能大幅提升 推理能力比肩 o1

DeepSeek 更新 R1 推理 AI 模型：代码生成与复杂推理性能大幅提升推理能力比肩 o1