AIGC宇宙 AIGC宇宙

AI 大战超级玛丽!Claude 3.7 封神:Gemini、GPT-4o 全军覆没,谁才是游戏界真王者?

谁是游戏界真王者?AI 竟向经典游戏《超级马力欧兄弟》发起挑战! 加州大学圣地亚哥分校 Hao 人工智能实验室传来惊人战报:在一场别开生面的 AI “马力欧” 大乱斗中,Anthropic 旗下的 Claude3.7模型 “一骑绝尘”,力压群雄,荣登 “最强 AI 马力欧” 宝座! 紧随其后的是同门师弟 Claude3.5,而谷歌 Gemini1.5Pro 和 OpenAI 的 GPT-4o 这两位 “AI 界大佬” 却意外 “翻车”,表现令人大跌眼镜!

谁是游戏界真王者?AI 竟向经典游戏《超级马力欧兄弟》发起挑战! 加州大学圣地亚哥分校 Hao 人工智能实验室传来惊人战报:在一场别开生面的 AI “马力欧” 大乱斗中,Anthropic 旗下的 Claude3.7模型 “一骑绝尘”,力压群雄,荣登 “最强 AI 马力欧” 宝座! 紧随其后的是同门师弟 Claude3.5,而谷歌 Gemini1.5Pro 和 OpenAI 的 GPT-4o 这两位 “AI 界大佬” 却意外 “翻车”,表现令人大跌眼镜! 这究竟是怎么回事?

这场 AI “马力欧” 争霸赛, 并非在古老的红白机上进行, 而是在一个 “高科技” 模拟器中展开。 研究人员专门打造了一个名为 GamingAgent 的框架, 作为 AI 与游戏世界的 “桥梁”。 在这个虚拟世界里, AI 化身 “马力欧”, 手握 “游戏手柄”, 接收来自系统的 “作战指令”: “前方有障碍!跳!”,“敌人来袭!躲!”, 指令简洁明了, 却也充满挑战。 系统还会 “贴心” 地送上游戏截图, 帮助 “AI 马力欧” “眼观六路,耳听八方”, 更好地 “掌控” 战局。 更酷的是, AI 竟然能 “现场编写” Python 代码, 指挥 “马力欧” 做出各种 “骚操作”, 上蹿下跳, 躲避障碍, 简直 “秀” 到飞起!

image.png

然而, 赛场上的 “战况” 却出人意料。 那些 “身经百战” 、 以 “推理能力” 著称的 AI 模型, 比如 OpenAI 的 o1, 竟然 “马失前蹄”, 表现还不如一些 “非推理型” 选手! 这是为何? 原来, “推理大神” 也有 “致命弱点”—— “反应太慢”! 在《超级马力欧兄弟》 这种 “分秒必争” 的实时游戏中, “推理模型” 需要花费数秒钟 “深思熟虑” 才能 “慢吞吞” 地做出决策, 但 “战机稍纵即逝”, 一秒钟的 “迟疑”, 就可能导致 “马力欧” “命丧黄泉”! 看来, 在瞬息万变的游戏世界里, “反应速度” 才是 “硬道理”!

尽管游戏早已成为 AI 竞技的 “重要舞台”, 但也有专家对此 “另眼相看”。 在他们看来, 游戏世界毕竟是 “虚拟世界”, 与 “真实世界” 相比, 还是 “Too young, Too simple”! 游戏环境 “过于简单” 和 “抽象”, AI 可以从中 “无限量” 地 “刷经验值”, 积累 “理论数据”, 但 “纸上谈兵终觉浅”, 这些 AI 模型的 “真实能力” 究竟如何, 还有待 “实战检验”。 OpenAI 的研究科学家安德烈・卡帕西 甚至发出了 “评估危机” 的 “灵魂拷问”, 让人不禁 “陷入沉思”。

不过, 质疑归质疑, 围观 AI “花式玩转” 超级玛丽, 依然是一场 “赏心悦目” 的 “技术秀”, 它生动地展现了 AI 技术的 “日新月异”, 也为我们打开了一扇 “窥探未来” 的 “窗口”。 谁能想到, 曾经只能在 “棋盘” 上 “运筹帷幄” 的 AI, 如今也能在 “游戏世界” 里 “大显身手”? 或许在不久的将来, AI 真的能 “统治” 游戏界, 甚至 “超越” 人类玩家, 成为 “游戏界” 的 “真·王者”! 让我们拭目以待!

相关资讯

用 ChatGPT 审讯“犯人”:《心跳 AI 审讯游戏》上线,如何审问是玩家自由

一款宣称全面运用 ChatGPT 的短篇审讯游戏 ——YAMADA 开发、发行的《心跳 AI 审讯游戏》于 25 日上线 Steam 平台,支持中文,国区售价 24.99 元,先期首发优惠 10% 后售价 22.49 元。IT之家提醒:游玩时需要 ChatGPT 可运行的网络环境。全面运用风靡全球的对话型 AI「ChatGPT」的短篇审讯游戏你将成为一名杰出的警员,对成为凶杀案嫌犯的『AI』执行审讯。如何提问完全是你的自由。『AI』的反应将由「ChatGPT」即时生成。该『AI』被安装了情感回路,会在你的审讯下逐渐
5/26/2024 3:53:56 PM
清源

万物皆可《毁灭战士》,专家利用 GPT-4V 模型运行该游戏

英国约克大学研究员 Adrian de Wynter 近日发表研究论文《Will GPT-4 Run DOOM?》,探讨了如何让 GPT-4V 模型来玩《毁灭战士》游戏。de Wynter 为此设计了一个系统,使用 GPT-4V(GPT4 的多模态衍生版本,可以接收图像作为输入)捕捉游戏引擎的画面截图,并返回游戏状态的结构化描述。他设计了一个 Agent 模型,根据视觉输入信息,并对比此前历史记录作出决策,并将其反应转化为《毁灭战士》游戏可以理解的按键命令。简单地说,系统会截取游戏截图,并利用这些截图找出游戏中发生
3/13/2024 10:19:25 AM
故渊

OpenAI 升级 o3-mini 模型思维链,提高 AI 推理透明度

OpenAI 公司今天(2 月 7 日)在 X 平台发布推文,宣布面向免费和付费用户更新 o3-mini 的思维链,并为付费用户更新 o3-mini-high 的思维链,更透明、更详细地展示模型的“推理”步骤以及得出答案的方式。
2/7/2025 7:20:02 AM
故渊
  • 1