29 年经典游戏被攻克：谷歌 Gemini 2.5 Pro 成功通关《宝可梦蓝》

作者：远洋 2025-05-04 07:55

谷歌Gemini 2.5 Pro成功通关29年前的经典游戏《宝可梦蓝》，展示了AI在游戏领域的突破。谷歌CEO皮查伊兴奋宣布这一成果，引发对AI游戏能力的讨论。#AI游戏# #Gemini#

谷歌最先进的人工智能模型取得了重大突破：成功通关了一款 29 年前的电子游戏。

谷歌首席执行官桑达尔・皮查伊（Sundar Pichai）在 X 网站上兴奋地宣布：“太精彩了！Gemini 2.5 Pro 刚刚完成了《宝可梦蓝》！”

据AI在线了解，此次直播活动名为“Gemini Plays Pokemon”，由一位名叫 Joel Z 的 30 岁软件工程师发起，他并非谷歌员工。尽管如此，谷歌高管们对这一尝试表示了支持。谷歌 AI Studio 的产品负责人洛根・基尔帕特里克（Logan Kilpatrick）上个月曾表示，Gemini 在完成《宝可梦》方面取得了显著进展，并且已经获得了第五个徽章（目前表现第二好的模型只获得了三个徽章，不过使用的是不同的代理框架）。皮查伊还开玩笑说：“我们正在开发 API，即人工宝可梦智能。”

为何选择《宝可梦》？早在今年 2 月，Anthropic 公司就曾强调其 Claude AI 模型在《宝可梦红》中的表现，称 Claude 的“深度思考和代理训练”使其在应对“更出人意料”的任务时更具优势，例如玩经典游戏。但 Claude 似乎尚未通关《宝可梦红》，这是否意味着 Gemini 在游戏方面表现更胜一筹？Joel Z 在他的 Twitch 页面上提醒观众：“请不要将此视为衡量大型语言模型（LLM）玩宝可梦能力的基准。两者之间无法进行直接比较，因为 Gemini 和 Claude 使用不同的工具，并且接收到的信息也不同。”

此外，两款 AI 模型都需要借助代理框架才能玩游戏。这些框架为模型提供带有额外信息的游戏截图，使模型能够据此做出决策（可能涉及调用专业代理），并按下与 AI 指令相对应的按钮。

Joel Z 承认，在帮助 Gemini 完成游戏的过程中，他确实进行了一些“开发干预”，但他强调这并非作弊。“我的干预是为了提升 Gemini 的整体决策和推理能力。我不会给出具体提示词，也不会为特定挑战（如月球山脉）提供攻略或直接指令。唯一接近这种情况的是，我告诉 Gemini 需要与火箭队小兵对话两次才能获得升空钥匙，这其实是一个在《宝可梦黄》中被修复的漏洞。”

他还表示：“Gemini Plays Pokémon 仍在积极开发中，其框架也在不断演变。”

想去哪就去哪！我用Nano Banana Pro做了个实时旅行相机

前几天 Nano Banana Pro 发布之后早上看到了 Deepmind 官方的一个用法，就是给到 Nano Banana Pro 经纬度让他直接生成对应地点的照片。主要基于 Nano Banana Pro 的实时检索能力，他可以通过经纬度知道这个地点的具体位置。我试了一下果然可以，而且我还给他生成的照片加上了对应的水印，同时让他检索对应位置的当前时间和天气，让生成的照片更加符合现实场景。

12/1/2025 1:58:26 AM

歸藏

谷歌最强AI不是Nano Banana？真正的王炸竟然是它！

你以为 Nano Banana 就是谷歌 AI 最强模型？那你就大错特错了！诚然，Nano Banana 能够将多张图像融合为一张、在复杂叙事中保持角色一致、通过自然语言指令进行精确转换，还能利用 Gemini 的知识库生成和编辑图像。

9/17/2025 2:03:35 AM

龙爪槐守望者

Gemini 3 的实力到底有多强？超多案例带你了解（附提示词）

大家应该看了很多 Gemini 3 的相关信息了，藏师傅这里就不废话了。简单说一下它有多强，从测试基准来看直接在几乎所有基准上都达到了 SOTA，同时相当一部分大幅领先第二名，当然除了 SWE-Bench 这个。用来验证 AI 是否脱离了“概率模仿”并开始产生“真正思考”的测试集 ARC-AGI v2 的得分上，甚至超过了现在最强模型的两倍以上，看看 Gemini 3 孤零零在的位置。

11/23/2025 12:36:13 AM

歸藏

29 年经典游戏被攻克：谷歌 Gemini 2.5 Pro 成功通关《宝可梦蓝》

相关资讯

想去哪就去哪！我用Nano Banana Pro做了个实时旅行相机

谷歌最强AI不是Nano Banana？真正的王炸竟然是它！

Gemini 3 的实力到底有多强？超多案例带你了解（附提示词）