谷歌首个通用推理模型登场：揭秘 AI 推理“黑匣子”，登顶 Arena LLM 排行榜

作者：故渊 2024-12-20 07:58

谷歌 AI Studio 平台昨日（12 月 19 日）发布实验性的“Gemini 2.0 Flash Thinking”模型，主打“清晰展现思考过程”，是谷歌第一个通用推理模型。

谷歌 AI Studio 平台昨日（12 月 19 日）发布实验性的“Gemini 2.0 Flash Thinking”模型，主打“清晰展现思考过程”，是谷歌第一个通用推理模型。

该模型不仅能够解答复杂问题，还能模仿人类逐步推理，展现其“思考”步骤，这一创新功能有望革新 AI 领域，和 OpenAI 的 o1 推理模型展开竞争。AI在线附上相关演示如下：

Google DeepMind 首席科学家 Jeff Dean 演示了该模型如何通过一系列“思考”步骤解决物理问题；而 Google 产品负责人 Logan Kilpatrick 展示了模型如何处理包含图像和文本信息的推理问题。

该模型基于 Gemini 2.0 Flash 的速度和性能构建，在 Chatbot Arena LLM 排行榜上，Gemini 2.0 Flash Thinking 模型在所有类别中均排名第一，较之前的 Gemini-2.0-Flash 模型有显著提升，尤其在“硬提示”和“视觉”两项分别提升了 14 分和 16 分。

谷歌首个通用推理模型登场：揭秘 AI 推理“黑匣子”，登顶 Arena LLM 排行榜

该模型目前已在 Google AI Studio 和 Vertex AI 平台上线。谷歌表示，这只是推理之旅的第一步，未来这些推理能力可能会集成到 Gemini 2.0 系列的主要模型中。

门板上做研究的首席科学家：Jeff Dean解密谷歌和Gemini背后的故事

“最开始我就知道谷歌相当有希望，谷歌能发展到现在的规模不过是水到渠成。 ”这位谷歌首席科学家在谷歌度过了近乎一半的人生，对谷歌的喜爱不减反增，到现在还依然坚守着谷歌最初的愿景并为此奋斗：组织全球信息并使其普遍可用和有用Jeff Dean 还记得刚加入谷歌的时候，每到周二的流量高峰期就开始担心系统会不会崩溃，还好后来及时增加了设备，对代码和搜索功能做了更多优化，谷歌搜索这才步入了正轨。后来吴恩达在谷歌担任顾问，Jeff Dean 和他商定了大型神经网络的研究目标，最终促成了 Google Brain 团队的成立。

9/19/2024 10:38:00 AM

刘洁

DeepMind夺得IMO官方「唯一」金牌，却成为OpenAI大型社死现场

刚刚，谷歌 DeepMind 宣布，其新一代 Gemini 进阶版模型在 IMO 竞赛中正式达到金牌得主水平，成功解决了六道超高难度试题中的五道，拿下 35 分（满分 42 分），成为首个获得奥赛组委会官方认定为金牌的AI系统。更重要的是，该系统首次证明人工智能无需依赖专业编程语言，仅通过自然语言理解即可攻克复杂数学难题。谷歌 DeepMind 首席执行官哈萨比斯在社交媒体平台 X 上强调：这是官方结果！

7/22/2025 1:22:00 PM

机器之心

29 年经典游戏被攻克：谷歌 Gemini 2.5 Pro 成功通关《宝可梦蓝》

谷歌Gemini 2.5 Pro成功通关29年前的经典游戏《宝可梦蓝》，展示了AI在游戏领域的突破。谷歌CEO皮查伊兴奋宣布这一成果，引发对AI游戏能力的讨论。#AI游戏# #Gemini#

5/4/2025 7:55:19 AM

远洋

谷歌首个通用推理模型登场：揭秘 AI 推理“黑匣子”，登顶 Arena LLM 排行榜

相关资讯

门板上做研究的首席科学家：Jeff Dean解密谷歌和Gemini背后的故事

DeepMind夺得IMO官方「唯一」金牌，却成为OpenAI大型社死现场

29 年经典游戏被攻克：谷歌 Gemini 2.5 Pro 成功通关《宝可梦蓝》