上线仅7天，阿里通义千问3问鼎全球开源模型

作者：AI在线 2025-05-07 10:01

近日，阿里巴巴推出的开源大模型 “通义千问3”（Qwen3）在上线仅七天后，便成功夺得了全球开源模型的冠军地位。这一成果是在国际权威大模型评测榜 LiveBench 最新发布的排名中取得的，标志着阿里在人工智能领域又一次取得了重要突破。据悉，通义千问3在指令遵循能力方面，表现超越了诸多顶级闭源模型，如 o3High、o4-Mini High 和 Gemini2.5pro，成功跻身全球第一的位置。

近日，阿里巴巴推出的开源大模型 “通义千问3”（Qwen3）在上线仅七天后，便成功夺得了全球开源模型的冠军地位。这一成果是在国际权威大模型评测榜 LiveBench 最新发布的排名中取得的，标志着阿里在人工智能领域又一次取得了重要突破。

据悉，通义千问3在指令遵循能力方面，表现超越了诸多顶级闭源模型，如 o3High、o4-Mini High 和 Gemini2.5pro，成功跻身全球第一的位置。这一榜单由著名图灵奖得主、Meta 首席 AI 科学家杨立昆联合纽约大学等多个机构共同发布，全面评估大模型的数学、推理、编程及语言理解等多个维度。由于其采用动态更新的题库，通义千问3被誉为 “全球首个无法作弊的模型基准测试”。

通义 Qwen (4)

图源备注：图片由AI生成

通义千问3的正式发布是在4月29日。该模型的参数量仅为 DeepSeek-R1的三分之一，成本大幅降低，同时性能却超越了包括 OpenAI 在内的多款全球顶尖模型。千问3是国内首个 “混合推理模型”，它结合了 “快思考” 和 “慢思考” 两种模式，能够在处理简单问题时快速响应，而在面对复杂问题时进行多步骤深入思考，这样不仅提高了算力的使用效率，也显著节省了资源。

另外，通义千问3的部署成本也非常友好，用户只需四张 H20就能实现千问3的满血版部署，显存占用仅为性能相近模型的三分之一。这一显著的性能提升，充分证明了阿里巴巴在大模型领域的创新能力与技术实力。

通义千问3的发布，将推动更多企业与开发者参与到开源 AI 模型的构建中，为行业的发展注入新的活力。随着大模型技术的不断进步，我们期待未来将有更多实用而创新的应用出现。

千亿规模参数，阿里云通义千问进化到2.0：性能超GPT-3.5，加速追赶GPT-4

10 月 31 日，阿里云正式发布千亿级参数大模型通义千问 2.0。在 10 个权威测评中，通义千问 2.0 综合性能超过 GPT-3.5，正在加速追赶 GPT-4。当天，通义千问 APP 在各大手机应用市场正式上线，所有人都可通过 APP 直接体验最新模型能力。过去 6 个月，通义千问 2.0 在性能上取得巨大飞跃，相比 4 月发布的 1.0 版本，通义千问 2.0 在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。目前，通义千问的综合性能已经超过 GPT-3.5，加速追赶 GPT-4。

10/31/2023 3:32:00 PM

机器之心

通义千问宣布“GPT-4 级”主力模型 Qwen-Long 降价 97%，一元 200 万 tokens

字节跳动 5 月 15 日正式发布了豆包大模型，宣布大模型价格进入“厘时代”，号称“比行业便宜 99.3%”。今日，阿里云紧随其后抛出重磅炸弹：通义千问 GPT-4 级主力模型 Qwen-Long 宣布降价，API 输入价格从 0.02 元 / 千 tokens 降至 0.0005 元 / 千 tokens，降幅 97%。简单来说，1 块钱可以买 200 万 tokens，相当于 5 本《新华字典》的文字量。这款模型最高支持 1 千万 tokens 长文本输入，降价后约为 GPT-4 价格的 1/400。参考IT之

5/21/2024 10:41:25 AM

问舟

工具大盘点！5款AI视频生成神器优缺点分析（附打分表）

24年初，Sora 爆红网络，随之大量的AI视频生成的产品趁势崛起。我们当时也做过相关产品的调研，并发布了文章11款AI视频生成神器优缺点分析。工具大盘点！

12/16/2024 12:13:49 AM

Infinite AI

上线仅7天，阿里通义千问3问鼎全球开源模型

相关资讯

千亿规模参数，阿里云通义千问进化到2.0：性能超GPT-3.5，加速追赶GPT-4

通义千问宣布“GPT-4 级”主力模型 Qwen-Long 降价 97%，一元 200 万 tokens

工具大盘点！5款AI视频生成神器优缺点分析（附打分表）