AIGC宇宙 AIGC宇宙

美团 LongCat-Flash 这个5600亿参数的懒AI,竟然比勤奋的模型跑得更快?

昨天晚上刷朋友圈,看到一个做AI的朋友发了条动态:"我们公司又烧了几百万训练大模型,结果推理速度还是慢得像老牛拉车。 "下面一堆同行在评论区哭穷,说什么GPU成本太高、训练时间太长、推理延迟要命。 正当大家集体吐槽的时候,美团悄悄放了个大招——LongCat-Flash。

美团 LongCat-Flash 这个5600亿参数的懒AI,竟然比勤奋的模型跑得更快?

昨天晚上刷朋友圈,看到一个做AI的朋友发了条动态:"我们公司又烧了几百万训练大模型,结果推理速度还是慢得像老牛拉车。"

下面一堆同行在评论区哭穷,说什么GPU成本太高、训练时间太长、推理延迟要命。 正当大家集体吐槽的时候,美团悄悄放了个大招——LongCat-Flash。 

这个家伙有5600亿参数,听起来就是个"大胃王",但神奇的是,它每次处理一个词的时候,只用270亿参数就够了。

这跟一个拥有5600个员工的公司,但每次只需要270个人上班就能搞定所有事情一样?

这个"偷懒"的AI到底有多聪明?

当你看到"the"这个词的时候,大脑几乎不用思考就知道它的意思;但遇到"量子纠缠"这种概念,大脑就会调动更多神经元来处理。

LongCat-Flash学会了这一招。

美团 LongCat-Flash 这个5600亿参数的懒AI,竟然比勤奋的模型跑得更快?

它创造了一种叫"零计算专家"的机制。

简单来说,就是在模型里安排了一批"摸鱼"专家,专门负责处理那些简单到不需要动脑子的词汇。遇到"的"、"了"、"是"这些词,直接交给摸鱼专家——输入什么就输出什么,连计算都省了。而真正需要深度思考的内容,才会动用那些"加班"专家。

我一个在大厂做算法的朋友听说这个设计后,拍着大腿说:"这不就是我们团队梦寐以求的吗?以前我们恨不得每个词都用最强的算力去处理,结果就是烧钱如流水。

现在人家美团告诉我们,该偷懒的时候就偷懒,该认真的时候就认真。"

更绝的是,LongCat-Flash还用了一个叫PID控制器的东西来管理这些"员工"。就像一个聪明的项目经理,实时监控每个专家的工作量,发现某个专家太忙了就给他减负,发现某个专家太闲了就给他加活。这样整个系统始终保持在最佳状态。

通信和计算的"双线程"魔法

如果说零计算专家解决了"用多少算力"的问题,那么快捷连接MoE就解决了"怎么用得更快"的问题。

传统的AI模型就像一个效率低下的工厂流水线:先分配任务,等所有工人到位,然后开始干活,干完活再收集结果。整个过程中,总有人在等待,总有设备在闲置。

美团 LongCat-Flash 这个5600亿参数的懒AI,竟然比勤奋的模型跑得更快?

LongCat-Flash的做法则是一个精明的工厂主管,他发现了一个秘密:在分配任务的同时,其实可以让另一批工人先干点别的活。这样一来,原本需要串行执行的工作变成了并行,大大提高了整体效率。

"这就像你一边等外卖,一边刷手机,时间利用率瞬间翻倍。"我那个大厂的朋友这样比喻,"以前我们的模型就像那种一根筋的人,必须等一件事做完才能做下一件事。现在人家美团的模型学会了多线程思维。"

结果呢?

LongCat-Flash在H800显卡上跑出了每秒100个token的推理速度,成本只要每百万token 5块钱。要知道,很多同等规模的模型,推理速度只有它的一半,成本却是它的好几倍。

智能体时代的"全能选手"

最让人眼前一亮的是LongCat-Flash在智能体任务上的表现。

什么是智能体?简单说就是能够自主思考、使用工具、与环境交互的AI助手。

有这样的场景:你让AI帮你订一张从北京到上海的机票。

传统的AI可能只会告诉你"我不能直接订票,但我可以告诉你怎么订"。而智能体AI会主动打开订票网站,查询航班信息,比较价格,甚至帮你完成支付。

LongCat-Flash在这方面简直是个"六边形战士"。在ArenaHard-V2测试中拿到86.5分,在智能体工具使用基准τ2-Bench中得分67.7,在复杂场景智能体基准VitaBench中更是以24.30的得分位列第一。

"这就像找了个既会写代码,又会做PPT,还会订外卖的全能助理。"一个在美团工作的产品经理朋友跟我说,"以前我们需要不同的AI工具来处理不同的任务,现在一个LongCat-Flash就够了。"

30天训练出来的"速成天才"

最让技术圈震惊的是,这么强大的模型居然只用了30天就训练完成。要知道,很多同等规模的模型需要几个月甚至半年的训练时间。

美团是怎么做到的?

除了前面提到的架构创新,他们还用了一套叫"超参迁移"的技术。简单说就是先用小模型找到最佳的训练参数,然后把这些参数"复制粘贴"到大模型上。这就像你先用小锅试验出完美的菜谱,然后直接用大锅按比例放大,省去了重新摸索的时间。

更绝的是,他们还用了"模型增长初始化"技术。

不是从零开始训练5600亿参数的模型,而是先训练一个2800亿参数的"半成品",然后通过层叠加的方式扩展到5600亿。

"这种做法太聪明了。"我认识的一个AI创业者感叹道,"我们之前训练大模型就像在黑暗中摸索,经常训练到一半发现方向错了,只能推倒重来。美团这套方法论,简直是给我们点了一盏明灯。"

结语

最让人意外的是,美团把LongCat-Flash完全开源了,采用MIT许可证,这意味着任何人都可以免费使用、修改,甚至商用。

在这个大模型军备竞赛的时代,开源一个5600亿参数的顶级模型,需要多大的勇气和格局?

这不仅是技术的分享了,更是对整个AI生态的贡献。

当每个开发者都能轻松获得这样强大的AI能力,会催生出多少创新的应用?也许下一个改变世界的AI产品,就诞生在某个大学宿舍里,或者某个创业公司的小办公室里。

LongCat-Flash的出现,不仅仅是美团在AI领域的一次技术突破,更像是给整个行业投下的一颗石子,激起的涟漪将会影响到每一个与AI相关的人!

相关资讯

美团找黄龄,饿了么请蓝盈莹,京东要不用AI找个代言人?

自从京东进军外卖行业,无论是骑手福利、广告舆论还是红包减免,都与美团外卖展开了全面竞争。 就在这红黄两家打得不可开交之际,市场占有率持续下滑的饿了么虽想加入战局却有心无力,只得发条微博调侃自己不参与口水战,顺便搞些活动发放红包来维持活跃度。 看上去这些广告卡通配图还是用 AI 生成的。
6/5/2025 12:34:00 AM
龙爪槐守望者

Manus逼OpenAI开源智能体框架,网友:已从行业领导者变为跟随者

OpenAI又开源了,这次是一套智能体开发框架。 联网搜索、文件搜索、计算机使用(Computer Use),统统打包,GitHub 8小时上千星。 图片奥特曼认为其中的API是有史以来(并没有限定在OpenAI范围内)设计最完善、最实用的之一。
3/12/2025 11:34:35 AM

广义智能体理论:智能时代通向「万物理论」的新路径?

在现代科学的宏伟蓝图上,「万物理论」(Theory of Everything)代表着一个大一统的梦想:构建一个包罗万象、逻辑自洽的理论体系。 它的雄心在于,用最少的本源法则,去解释宇宙间森罗万象的现象——从宇宙大爆炸的奇点、时空本身的弯曲,到基本粒子的相互作用、再到化学键的构成、DNA链的螺旋,直至智能的萌发与自我意识的诞生。 然而,通往这一「梦想」理论的道路上,横亘着现代物理学最深刻的两大鸿沟:其一,是在宏观尺度上描述引力的广义相对论,与在微观尺度上主导一切的量子力学之间,存在着根本性的不相容;其二,物理学中的四大基本作用力(引力、电磁力、强核力、弱核力)至今未能被纳入一个统一的理论之中。
7/18/2025 10:19:49 AM
  • 1