AIGC宇宙 AIGC宇宙

谷歌推理最快、成本效益最高 AI 模型:Gemini 2.5 Flash-Lite 亮相,全面升级编码、翻译、推理

Flash-Lite在编码、数学、科学推理及多模态任务中表现全面超越前代2.0 Flash-Lite,推理速度提升且延迟更低,适合实时翻译、分类等高吞吐量场景。
感谢谷歌公司今天(6 月 18 日)发布博文,在宣布 Gemini 2.5 Flash 和 Gemini 2.5 Pro 模型进入稳定阶段之外,还推出全新轻量级模型 Gemini 2.5 Flash-Lite

AI在线援引博文介绍,谷歌官方表示,Gemini 2.5 Flash 和 Gemini 2.5 Pro 两款模型已通过大规模测试,可稳定支持生产级应用开发。Spline、Rooms 等公司,以及 Snap、SmartBear 等企业,已在过去数周内使用最新版本开发实际应用。

谷歌推理最快、成本效益最高 AI 模型:Gemini 2.5 Flash-Lite 亮相,全面升级编码、翻译、推理

谷歌表示 Gemini 2.5 系列以平衡“成本-速度-性能”为核心设计目标,兼顾高效推理与经济性,伴随着稳定版上线,确保开发者能以更高信心构建复杂系统。

谷歌同步推出 Gemini 2.5 Flash-Lite 的预览版本,这是目前该系列中成本效益最高、推理速度最快的模型。

测试显示,Flash-Lite 在代码编写、科学计算、多模态分析等任务中,综合质量超越前代 2.0 Flash-Lite;其延迟表现也优于 2.0 版本,在翻译、分类等需要快速响应的场景中尤为突出。

谷歌推理最快、成本效益最高 AI 模型:Gemini 2.5 Flash-Lite 亮相,全面升级编码、翻译、推理

该模型继承 Gemini 2.5 系列核心能力,包括灵活控制推理预算、连接外部工具(如谷歌搜索、代码执行)以及支持 100 万 token 超长上下文处理。

开发者可通过 Google AI Studio、Vertex AI 平台访问 2.5 Flash 和 Pro 的稳定版本,以及 Flash-Lite 的预览版本。此外,Gemini 应用端也已集成 2.5 Flash 和 Pro,而谷歌搜索则部署了定制化版本的 Flash-Lite 和 Flash 模型以提升服务效率。

谷歌推理最快、成本效益最高 AI 模型:Gemini 2.5 Flash-Lite 亮相,全面升级编码、翻译、推理

相关资讯

IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线

IBM 近日宣布,其 AI 开发平台 watsonx.ai 现已支持 DeepSeek-R1蒸馏版的 Llama3.18B和 Llama3.370B模型。 DeepSeek 通过知识蒸馏技术,利用 R1模型生成的数据对多个 Llama和 Qwen变体进行了优化,进一步提升了模型性能。 在 watsonx.ai平台上,用户可以通过两种方式使用 DeepSeek 蒸馏模型。
2/11/2025 2:25:00 PM
AI在线

DeepSeek-R1 登顶 Hugging Face:以10000 赞力压 150 万个模型

今日凌晨,全球最大开源平台之一 Hugging Face 的首席执行官 Clement Delangue 在社交平台发文宣布,DeepSeek-R1在 Hugging Face 上获得了超过10000个赞,成为该平台近150万个模型中最受欢迎的大模型。 这一里程碑式的成就标志着 DeepSeek-R1在全球 AI 社区中的广泛认可与影响力。 DeepSeek-R1的崛起速度令人瞩目。
2/24/2025 9:30:00 AM
AI在线

DeepSeek 更新 R1 推理 AI 模型:代码生成与复杂推理性能大幅提升 推理能力比肩 o1

DeepSeek 公司近日对其高性能推理 AI 模型 DeepSeek-R1进行了重大更新,显著提升了模型在代码生成和复杂推理任务中的表现,引发人工智能领域的广泛关注。 以下基于公开信息和最新动态,全面解析此次更新的关键亮点。 R1模型更新:代码能力大幅提升DeepSeek-R1的最新更新在代码生成能力上取得了显著突破。
5/29/2025 10:01:21 AM
AI在线
testab