AIGC宇宙 AIGC宇宙

小巧却强大的推理引擎!Ring-mini-2.0 震撼发布,性能超越10B模型

今天,我们正式推出了 Ring-mini-2.0,这是一款基于 Ling-mini-2.0架构深度优化的高性能推理型 MoE 模型。 Ring-mini-2.0的总参数量达到16B,但在实际运行中仅需激活1.4B 参数,便能实现相当于10B 级别以下的密集模型的推理能力。 这款模型在逻辑推理、编程和数学任务中表现尤为出色,支持128K 的长上下文,使得其在各种应用场景中都能展现出强大的能力。

今天,我们正式推出了 Ring-mini-2.0,这是一款基于 Ling-mini-2.0架构深度优化的高性能推理型 MoE 模型。Ring-mini-2.0的总参数量达到16B,但在实际运行中仅需激活1.4B 参数,便能实现相当于10B 级别以下的密集模型的推理能力。

这款模型在逻辑推理、编程和数学任务中表现尤为出色,支持128K 的长上下文,使得其在各种应用场景中都能展现出强大的能力。此外,Ring-mini-2.0的生成速度也相当惊人,能够实现300+ token/s 的快速生成,经过优化后更是可以突破500+ token/s。

大模型 元宇宙 (1)

图源备注:图片由AI生成,图片授权服务商Midjourney

在推理能力的提升方面,Ring-mini-2.0在 Ling-mini-2.0-base 的基础上进行了更深层次的训练,通过 Long-COT SFT、大规模 RLVR 和 RLHF 的联合优化,显著增强了模型在复杂推理任务中的稳定性和泛化能力。我们在多个高难度基准测试中,发现其性能显著超越了10B 以下的密集模型,甚至可以与一些更大型的 MoE 模型相媲美,特别是在逻辑推理方面表现优异。

此外,Ring-mini-2.0在设计上注重高效性,通过1/32的专家激活比和 MTP 层架构优化,实现了约7-8B 密集模型的等效性能。这种高稀疏度和小激活设计,使得其在 H20环境下可以实现300+ token/s 的推理速度,同时结合 Expert Dual Streaming 的优化,进一步降低了推理成本。

为了促进学术与工业界的研究和应用,Ring-mini-2.0的模型权重、训练策略和数据配方将全面开源。我们期待这款 “小而优” 的模型能够成为小型推理模型的首选,并欢迎大家访问我们的开源仓库进行下载和使用。未来,在 Ling2.0架构的支持下,我们将继续推出更大、更快、更强的语言模型和全模态模型,敬请期待!

相关资讯

专家圆桌:“国产类 ChatGPT ”所存在的差距与挑战

内容来源:ChatGPT 及大模型专题研讨会 转载自CSDN稿件在经历寒冬、雾霾,甚至大家纷纷看不到希望之际,ChatGPT 犹如一场春雨,给做 AI 甚至 NLP 等研究的人带来了新的希望。3 月 11 日,由中国人工智能学会主办,中国人工智能学会 NLP 专委会、真格基金、达观数据共同承办,中国信通院云大所支持的「ChatGPT 及大模型专题研讨会」正式举行。在圆桌对话环节,来自学术界、产业界及投资界的知名专家学者,就 ChatGPT 引发的新 AI 浪潮、大模型“基础模型”论、“国产类 ChatGPT ”所存
4/21/2023 9:41:00 AM
达观数据

ChatGPT在iOS美区下载火爆,6天内下载量超过 50 万次

Open AI ChatGPT正在美版iOS市场大杀四方。5月26日,根据App分析厂商Data.AI的消息,ChatGPT在推出后的六天内已经突破了50万次下载,成为美区最近两年内增长速度最快的新应用之一。与此同时,ChatGPT正在美区APP Store掀起一股AI聊天热潮,相关领域的一些消费欺诈也随着ChatGPT的火爆而出现。据TechCrunch报道,随着消费者热情不断高涨,许多其他自称为“ChatGPT”或“AI聊天机器人”的第三方应用也纷纷涌入App Store。其中许多其实本质上都是欺诈应用,试图欺
5/26/2023 7:23:00 PM
yangdz

Llama 2 的入门与实战,机器之心邀请了 4 位技术大牛手把手教你

机器之能报道编辑:Sia「Llama 2 大模型算法与应用实践」-机器之心 AI 技术论坛将于 8 月 26 日在北京举办。如果要问「2023 年最火的动物是什么?」AI 圈外的人可能会回答「熊猫」,并给你列出一长串熊猫的名字。而 AI  圈内的人八成会回答「羊驼」。而且,他们也能给你列出一长串「羊驼」的名字:llama、vicuna、alpaca…… 得益于 Meta Llama 模型的开源,AI 社区的研究者对生物学羊驼属的英文单词已经如数家珍,每个单词都对应着一个(或一组)基于 Llama 的微调模型。这些模
7/30/2023 11:42:00 PM
机器之能
  • 1