AIGC宇宙 AIGC宇宙

独家 | 月之暗面正在进行两亿美元融资,投前估值高达 15 亿美元

作者丨郭   思编辑丨陈彩娴AI 科技评论独家获悉,月之暗面近日正在进行 2 亿美元融资,本轮投资由蚂蚁和阿里集团共同投资,投前估值预计 15 亿美元。 据了解,月之暗面团队成员人数在100人至200人之间。 团队创始人杨植麟是一个90后,本科毕业于清华大学计算机科学与技术系,博士就读于全美自然语言处理排名第一的卡内基梅隆大学语言技术研究所(LTI),师从苹果AI研究负责人Ruslan Salakhutdinov、谷歌首席科学家William Cohen。

独家 | 月之暗面正在进行两亿美元融资,投前估值高达 15 亿美元

作者丨郭   思

编辑丨陈彩娴

AI 科技评论独家获悉,月之暗面近日正在进行 2 亿美元融资,本轮投资由蚂蚁和阿里集团共同投资,投前估值预计 15 亿美元。据了解,月之暗面团队成员人数在100人至200人之间。

团队创始人杨植麟是一个90后,本科毕业于清华大学计算机科学与技术系,博士就读于全美自然语言处理排名第一的卡内基梅隆大学语言技术研究所(LTI),师从苹果AI研究负责人Ruslan Salakhutdinov、谷歌首席科学家William Cohen。在博士期间,杨植麟用4年时间完成了一般6年才能完成的博士课程,并连续作为第一作者发表了两项关键研究成果——Transformer-XL和XLNet。Transformer-XL 成为首个全面超越 RNN 的注意力语言模型,相关论文是 NeurIPS 2019 与 ACL 2019 的最高引论文之一;XLNet 则在 20 项任务上超越谷歌 BERT 模型。截至目前,杨植麟本人学术引用量自2019年起已超2万余次。

独家 | 月之暗面正在进行两亿美元融资,投前估值高达 15 亿美元

杨植麟个人谷歌学术界面

此外,团队的联合创始人周昕宇与吴育昕,均为清华大学校友,具备深厚的技术底蕴。团队现已汇聚了来自 CMU LTI、Google、Meta(原Facebook)、Amazon等全球顶级学术机构及科技公司的诸多海外高层次人才,共同致力于前沿AI技术的研发与创新。AI 科技评论获知,月之暗面在人工智能领域持有明确立场,特别是在大语言模型的应用与融合方面,杨植麟的理解独到,坚定走 To C 道路,路线也一直是产品驱动。技术优势上,月之暗面最为称道的则是 Kimi Chat 的长文本基础技术能力。

11月,Kimi Chat宣布全面对外开放,不再限制内测资格,能高效处理约20万汉字的上下文。杨植麟曾在演讲中表示,规模化是通向AGI的核心,而随着模型不断迭代,长文本会逐渐取代微调,成为定制模型的关键技术。但通过滑动窗口、降采样、小模型等技术捷径实现上下文窗口延长,都是“技术捷径”。

目前符合大模型技术原理的做法是通过对数据的无损压缩,以真正提升模型能力。近期频繁霸榜热门游戏应用“哄哄模拟器”受益于月之暗面的技术支撑。该模拟器设计了各类情侣互动情境,由AI角色模拟真实对话,通过系统计算的“原谅值”动态反馈用户的沟通技巧。哄哄模拟器在短时间内迅速走红,在线用户人数突破一万,快速消耗了过亿 tokens。创始人王登科透露,为应对庞大的 token 消耗需求,哄哄模拟器团队已与月之暗面展开深度合作,全面采用其API接口,实际效果优于此前使用的GPT系列技术,尤其在遵循指定文本格式及刺激用户互动方面表现出色。

这个成功案例凸显了月之暗面在中文语境理解和C端用户体验上的显著优势。知情人士透露,月之暗面预计下月或将低调推出媲美 GPT-4 级别的新模型,直接整合至 Kimi Chat并同步发布两款相关应用,但不会过多张扬,而是以实际行动展现其技术领先性。2024年已过去一个月,月之暗面蓄势待发,大模型领域的竞争已然掀起狂澜,群雄并起。其余大模型企业融资及发展情况如何?欢迎添加作者微信(lionceau2046)交流,互通有无。

相关资讯

腾讯云上线DeepSeek全系API接口并打通联网搜索

腾讯云上线DeepSeek全系API接口并打通联网搜索

腾讯云宣布完成对深度求索(DeepSeek)大模型的深度整合——正式上线DeepSeek-R1和V3原版模型的API接口,并创新性接入自研大模型知识引擎,同步开放联网搜索能力。 凭借腾讯云在推理并发和生成速率等方面的优化,用户可以获得更加稳定、安全、低门槛的使用体验。 开发者只需在云上简单三步即可实现API接口调用,并通过大模型知识引擎提供的文档解析、拆分、embedding、多轮改写等能力,灵活构建专属的AI服务。
2/8/2025 2:09:00 PM AI在线
微信搜索接入DeepSeek大模型 称AI不会使用朋友圈聊天等信息

微信搜索接入DeepSeek大模型 称AI不会使用朋友圈聊天等信息

近日,微信宣布其搜索功能接入 DeepSeek-R1模型,目前处于灰度测试阶段。 部分用户在微信搜索框选择 AI 搜索时,可体验到 DeepSeek-R1提供的深度思考功能。 微信方面表示,引入大模型旨在提升搜索的智能化和精准度,更好地理解用户搜索意图,分析处理复杂查询。
2/19/2025 11:18:00 AM AI在线
DeepSeek-R1 登顶 Hugging Face:以10000 赞力压 150 万个模型

DeepSeek-R1 登顶 Hugging Face:以10000 赞力压 150 万个模型

今日凌晨,全球最大开源平台之一 Hugging Face 的首席执行官 Clement Delangue 在社交平台发文宣布,DeepSeek-R1在 Hugging Face 上获得了超过10000个赞,成为该平台近150万个模型中最受欢迎的大模型。 这一里程碑式的成就标志着 DeepSeek-R1在全球 AI 社区中的广泛认可与影响力。 DeepSeek-R1的崛起速度令人瞩目。
2/24/2025 9:30:00 AM AI在线