AIGC宇宙 AIGC宇宙

月之暗面 Kimi 联合清华大学等开源大模型推理架构 Mooncake

作者:汪淼
2024-11-28 01:06
本次开源将采用分阶段的方式,逐步开源高性能 KVCache 多级缓存 Mooncake Store 的实现,同时针对各类推理引擎和底层存储 / 传输资源进行兼容。
感谢月之暗面 Kimi 和清华大学 MADSys 实验室 2024 年 6 月联合发布了 Kimi 底层的 Mooncake 推理系统设计方案。该系统基于以 KVCache 为中心的 PD 分离和以存换算架构,提升了推理吞吐量

图片

近日,为了进一步加速该技术框架的应用与推广,月之暗面 Kimi 和清华大学 MADSys 实验室联合 9#AISoft、阿里云、华为存储、面壁智能、趋境科技等共同发布开源项目 Mooncake,共建以 KVCache 为中心的大模型推理架构。

11 月 28 日,Mooncake 技术框架已开源上线,AI在线附地址如下:

https://github.com/kvcache-ai/Mooncake

月之暗面 Kimi 联合清华大学等开源大模型推理架构 Mooncake

据介绍,Mooncake 开源项目从论文延伸,以超大规模 KVCache 缓存池为中心,通过以存换算的创新理念大幅度减少算力开销,提升了推理吞吐量。

本次开源将采用分阶段的方式,逐步开源高性能 KVCache 多级缓存 Mooncake Store 的实现,同时针对各类推理引擎和底层存储 / 传输资源进行兼容。其中传输引擎 Transfer Engine 部分现在已经在 GitHub 全球开源。

Mooncake 开源项目的最终目标是,为大模型时代打造一种新型高性能内存语义存储的标准接口,并提供参考实现方案。

Mooncake 推理系统架构图

Mooncake 推理系统架构图

相关资讯

月之暗面因 DeepSeek 调整工作重心?内部人士:强化学习或许会是个方向

2 月 15 日下午消息,据媒体报道,月之暗面内部已经将“持续拿到 SOTA 结果”确定为当下最重要的工作目标。2025 年,月之暗面围绕模型能力的关键方向除了继续强化多模态部分外,还会继续强化长文本推理能力。
2/15/2025 4:51:20 PM
凌辰

消息称 Kimi 大砍投放预算,DeepSeek 冲击之下月之暗面暂缓“烧钱”投广告

月之暗面近期决定大幅收缩产品投放预算,包括暂停多个安卓渠道的投放,以及第三方广告平台的合作。(界面新闻)
2/18/2025 4:41:14 PM
汪淼

Kimi大幅削减广告预算,DeepSeek崛起令月之暗面压力倍增

在国内 AI 领域,Kimi 曾是备受关注的创业产品,但随着 DeepSeek 的崛起,这一局面正悄然改变。 近日,月之暗面公司宣布将大幅削减 Kimi 的广告投放预算,暂停多个安卓渠道的推广以及与第三方广告平台的合作,这一决策显然是对 DeepSeek 迅猛发展的直接反应。 根据界面新闻的报道,DeepSeek 在短短数十天内成功吸引了3500万日活跃用户,而 Kimi 在过去一年多的时间内投入大量资金,日活跃用户却未能突破千万。
2/18/2025 5:09:00 PM
AI在线
  • 1