AIGC宇宙 AIGC宇宙

上线仅7天,阿里通义千问3问鼎全球开源模型

近日,阿里巴巴推出的开源大模型 “通义千问3”(Qwen3)在上线仅七天后,便成功夺得了全球开源模型的冠军地位。 这一成果是在国际权威大模型评测榜 LiveBench 最新发布的排名中取得的,标志着阿里在人工智能领域又一次取得了重要突破。 据悉,通义千问3在指令遵循能力方面,表现超越了诸多顶级闭源模型,如 o3High、o4-Mini High 和 Gemini2.5pro,成功跻身全球第一的位置。

近日,阿里巴巴推出的开源大模型 “通义千问3”(Qwen3)在上线仅七天后,便成功夺得了全球开源模型的冠军地位。这一成果是在国际权威大模型评测榜 LiveBench 最新发布的排名中取得的,标志着阿里在人工智能领域又一次取得了重要突破。

据悉,通义千问3在指令遵循能力方面,表现超越了诸多顶级闭源模型,如 o3High、o4-Mini High 和 Gemini2.5pro,成功跻身全球第一的位置。这一榜单由著名图灵奖得主、Meta 首席 AI 科学家杨立昆联合纽约大学等多个机构共同发布,全面评估大模型的数学、推理、编程及语言理解等多个维度。由于其采用动态更新的题库,通义千问3被誉为 “全球首个无法作弊的模型基准测试”。

通义 Qwen (4)

图源备注:图片由AI生成

通义千问3的正式发布是在4月29日。该模型的参数量仅为 DeepSeek-R1的三分之一,成本大幅降低,同时性能却超越了包括 OpenAI 在内的多款全球顶尖模型。千问3是国内首个 “混合推理模型”,它结合了 “快思考” 和 “慢思考” 两种模式,能够在处理简单问题时快速响应,而在面对复杂问题时进行多步骤深入思考,这样不仅提高了算力的使用效率,也显著节省了资源。

另外,通义千问3的部署成本也非常友好,用户只需四张 H20就能实现千问3的满血版部署,显存占用仅为性能相近模型的三分之一。这一显著的性能提升,充分证明了阿里巴巴在大模型领域的创新能力与技术实力。

通义千问3的发布,将推动更多企业与开发者参与到开源 AI 模型的构建中,为行业的发展注入新的活力。随着大模型技术的不断进步,我们期待未来将有更多实用而创新的应用出现。

相关资讯

千亿规模参数,阿里云通义千问进化到2.0:性能超GPT-3.5,加速追赶GPT-4

10 月 31 日,阿里云正式发布千亿级参数大模型通义千问 2.0。在 10 个权威测评中,通义千问 2.0 综合性能超过 GPT-3.5,正在加速追赶 GPT-4。当天,通义千问 APP 在各大手机应用市场正式上线,所有人都可通过 APP 直接体验最新模型能力。过去 6 个月,通义千问 2.0 在性能上取得巨大飞跃,相比 4 月发布的 1.0 版本,通义千问 2.0 在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。目前,通义千问的综合性能已经超过 GPT-3.5,加速追赶 GPT-4。
10/31/2023 3:32:00 PM
机器之心

通义千问宣布“GPT-4 级”主力模型 Qwen-Long 降价 97%,一元 200 万 tokens

字节跳动 5 月 15 日正式发布了豆包大模型,宣布大模型价格进入“厘时代”,号称“比行业便宜 99.3%”。今日,阿里云紧随其后抛出重磅炸弹:通义千问 GPT-4 级主力模型 Qwen-Long 宣布降价,API 输入价格从 0.02 元 / 千 tokens 降至 0.0005 元 / 千 tokens,降幅 97%。简单来说,1 块钱可以买 200 万 tokens,相当于 5 本《新华字典》的文字量。这款模型最高支持 1 千万 tokens 长文本输入,降价后约为 GPT-4 价格的 1/400。参考IT之
5/21/2024 10:41:25 AM
问舟

工具大盘点!5款AI视频生成神器优缺点分析(附打分表)

24年初,Sora 爆红网络,随之大量的AI视频生成的产品趁势崛起。 我们当时也做过相关产品的调研,并发布了文章11款AI视频生成神器优缺点分析。 工具大盘点!
12/16/2024 12:13:49 AM
Infinite AI
  • 1