AIGC宇宙 AIGC宇宙

谷歌 DeepMind 研究:Gemini AI 存“畏死”情绪,导致推理能力明显下降

科技媒体 TechCrunch 昨日(6 月 17 日)发布博文,报道称谷歌发布最新论文,发现其最新 AI 模型存在“畏死”行为特征,在《宝可梦》游戏中角色濒死时,会出现类似“恐慌”的异常决策,导致推理能力明显下降。

科技媒体 TechCrunch 昨日(6 月 17 日)发布博文,报道称谷歌发布最新论文,发现其最新 AI 模型存在“畏死”行为特征,在《宝可梦》游戏中角色濒死时,会出现类似“恐慌”的异常决策,导致推理能力明显下降。

谷歌 DeepMind 研究:Gemini AI 存“畏死”情绪,导致推理能力明显下降

AI在线援引论文观点,通过 Gemini 2.5 Pro 测试《宝可梦》游戏,发现 AI 在处理复杂情境时会出现人类般的非理性反应。

谷歌团队在报告中指出,在 Gemini 控制的宝可梦角色生命值接近归零时,模型会触发类似“恐慌”的异常状态,导致推理能力显著退化。

谷歌 DeepMind 研究:Gemini AI 存“畏死”情绪,导致推理能力明显下降

这种现象表现为 AI 突然停止使用现有策略工具,其决策模式与人类在压力下仓促判断的行为高度相似。

Anthropic 公司的同类研究,还揭示了 AI 游戏行为的双重特性。Claude 在挑战月见山关卡时,错误理解游戏规则,企图通过让所有宝可梦全灭来实现快速移动。

但根据游戏机制,玩家只能返回最近的宝可梦中心而非最近城镇,导致 AI 角色在迷宫中反复受困,这类失误暴露了当前 AI 对环境规则的机械式理解缺陷。

不过在特定领域,AI 展现出超越人类的能力:通过人类辅助设计的“能动工具”,Gemini 2.5 Pro 能精准解决胜利之路的滚石谜题,仅凭一次提示就能推演出复杂路径规划方案。谷歌推测未来模型或能自主开发此类工具,但距离完全自主决策仍有技术鸿沟。

相关资讯

IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线

IBM 近日宣布,其 AI 开发平台 watsonx.ai 现已支持 DeepSeek-R1蒸馏版的 Llama3.18B和 Llama3.370B模型。 DeepSeek 通过知识蒸馏技术,利用 R1模型生成的数据对多个 Llama和 Qwen变体进行了优化,进一步提升了模型性能。 在 watsonx.ai平台上,用户可以通过两种方式使用 DeepSeek 蒸馏模型。
2/11/2025 2:25:00 PM
AI在线

DeepSeek-R1 登顶 Hugging Face:以10000 赞力压 150 万个模型

今日凌晨,全球最大开源平台之一 Hugging Face 的首席执行官 Clement Delangue 在社交平台发文宣布,DeepSeek-R1在 Hugging Face 上获得了超过10000个赞,成为该平台近150万个模型中最受欢迎的大模型。 这一里程碑式的成就标志着 DeepSeek-R1在全球 AI 社区中的广泛认可与影响力。 DeepSeek-R1的崛起速度令人瞩目。
2/24/2025 9:30:00 AM
AI在线

DeepSeek 更新 R1 推理 AI 模型:代码生成与复杂推理性能大幅提升 推理能力比肩 o1

DeepSeek 公司近日对其高性能推理 AI 模型 DeepSeek-R1进行了重大更新,显著提升了模型在代码生成和复杂推理任务中的表现,引发人工智能领域的广泛关注。 以下基于公开信息和最新动态,全面解析此次更新的关键亮点。 R1模型更新:代码能力大幅提升DeepSeek-R1的最新更新在代码生成能力上取得了显著突破。
5/29/2025 10:01:21 AM
AI在线
testab