AIGC宇宙 AIGC宇宙

谷歌“深夜反击”OpenAI:Gemini 3 Flash 模型发布,部分测试优于 GPT-5.2

AI在线 12 月 18 日消息,距离 Gemini 3 Pro 发布不到一个月后的北京时间今天凌晨,谷歌宣布推出更注重效率的 Gemini 3 Flash。 谷歌为其给出的定位十分明确:在显著降低使用成本的同时,尽可能保留旗舰模型的专业级推理能力,让模型更适合日常场景。 测试结果显示,Gemini 3 Flash 不仅全面超越 Gemini 2.5 Pro 多款前代模型,还在多项对比中能够与 OpenAI 的 GPT-5.2 分庭抗礼。

AI在线 12 月 18 日消息,距离 Gemini 3 Pro 发布不到一个月后的北京时间今天凌晨,谷歌宣布推出更注重效率的 Gemini 3 Flash。

谷歌“深夜反击”OpenAI:Gemini 3 Flash 模型发布,部分测试优于 GPT-5.2

谷歌为其给出的定位十分明确:在显著降低使用成本的同时,尽可能保留旗舰模型的专业级推理能力,让模型更适合日常场景

测试结果显示,Gemini 3 Flash 不仅全面超越 Gemini 2.5 Pro 多款前代模型,还在多项对比中能够与 OpenAI 的 GPT-5.2 分庭抗礼。后者正是 OpenAI 为回应 Gemini 3 Pro 而紧急推出的新模型。

在 Humanity's Last Exam 等高难度测试中,双方在不借助搜索等外部工具的情况下,分差不足 1 个百分点

在专门用于评估多模态理解和推理能力的 MMMU-Pro 测试中,Gemini 3 Flash 取得了 81.2% 的成绩,高于 GPT-5.2 的 79.5%。

结果显示,Gemini 3 Flash 在“Extra High”推理模式下仍能与 GPT-5.2 保持接近,已显露出对 OpenAI 不容忽视的竞争压力。

谷歌“深夜反击”OpenAI:Gemini 3 Flash 模型发布,部分测试优于 GPT-5.2

据AI在线了解,谷歌已将 Gemini 3 Flash 作为默认模型推送至 Gemini App 以及搜索中的 AI Mode。谷歌表示,该模型面向全球用户免费开放,带来更强的日常 AI 能力。

此外,谷歌 AI Mode 还新增了对 Nano Banana Pro 的直接访问入口。美国地区的用户只需在模型选择器中依次启用“Thinking with 3 Pro”和“Create Images Pro”,即可在聊天界面生成图像。

相关资讯

自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言

围绕 DeepSeek 的谣言实在太多了。 面对 DeepSeek R1 这个似乎「一夜之间」出现的先进大模型,全世界已经陷入了没日没夜的大讨论。 从它的模型能力是否真的先进,到是不是真的只用了 550W 进行训练,再到神秘的研究团队,每个角度都是话题。
2/5/2025 2:37:00 PM
机器之心

程序员购买OGOpenAI.com域名转向DeepSeek

最近,一名软件工程师以 “不到一顿 Chipotle 餐的价格” 购买了 OGOpenAI.com 域名,并将其重定向至中国人工智能实验室 DeepSeek 的网站。 该实验室在开源 AI 领域崭露头角,吸引了广泛的关注。 据软件工程师阿纳奈・阿罗拉(Ananay Arora)向《TechCrunch》透露,他的初衷是为了支持 DeepSeek,因为该实验室最近推出了一款名为 DeepSeek-R1的开放版本模型,声称在某些基准测试中表现优于 OpenAI 的 o1。
1/23/2025 4:32:00 PM
AI在线

腾讯云上线DeepSeek全系API接口并打通联网搜索

腾讯云宣布完成对深度求索(DeepSeek)大模型的深度整合——正式上线DeepSeek-R1和V3原版模型的API接口,并创新性接入自研大模型知识引擎,同步开放联网搜索能力。 凭借腾讯云在推理并发和生成速率等方面的优化,用户可以获得更加稳定、安全、低门槛的使用体验。 开发者只需在云上简单三步即可实现API接口调用,并通过大模型知识引擎提供的文档解析、拆分、embedding、多轮改写等能力,灵活构建专属的AI服务。
2/8/2025 2:09:00 PM
AI在线
testab