AIGC宇宙 AIGC宇宙

最新外国「自研」大模型,都是套壳国产?

外国开发者:我们该开始学习中文了吗? 绷不住了,美国科技公司最新发布的大模型,思考时怎么一直在说中文? 本周,知名 AI 代码工具 Cursor 发布了 2.0 版重大更新,推出了首个自家的代码模型 Composer,以及用于并行协作多个智能体的新界面。

外国开发者:我们该开始学习中文了吗?

绷不住了,美国科技公司最新发布的大模型,思考时怎么一直在说中文?

图片

本周,知名 AI 代码工具 Cursor 发布了 2.0 版重大更新,推出了首个自家的代码模型 Composer,以及用于并行协作多个智能体的新界面。

新模型一发布,大家在祝贺 Cursor 终于「扬眉吐气」、用上自家模型的同时,也发现这个大模型在思考的时候一直讲中文,而且行为和国产模型极其相似。

Composer 是 Cursor 使用强化学习训练的一个大型 MoE 模型,能够出色地处理实际代码,并且速度非常快。

图片

内部基准测试中该模型在编码任务上达到行业前沿水准,生成速度比同类模型快四倍。

图片

据官方博客介绍,在研发过程中,他们试验了一个代号为 Cheetah 的原型智能体模型,以更好地理解更高速智能体模型的影响。Composer 是该模型的更智能升级版,凭借足够的速度支撑交互式体验,让编码始终丝滑。

不过在看到模型输出了这么多中文之后,人们纷纷开始猜测它背后的「基础」是哪家大模型,难道是 Qwen Code?

图片

无独有偶。

AI 编程独角兽 Cognition 近期也推出了他们最新 AI 模型 SWE-1.5。这是一款快速智能体模型,参数量达到了数千亿,在编码性能上接近 SOTA,并显著提升了速度 —— 比 Haiku 4.5 快 6 倍,比 Sonnet 4.5 快 13 倍。

图片

目前该模型已在他们的 IDE 平台 Windsurf 上开放使用。

图片

不过,模型发布出来之后很快就被人们仔细分析了一通,有网友认为 Cognition 的新模型背后也是基于中国的 AI 模型进行开发和改进的。

有人对 SWE 1.5 进行了大模型「越狱」,结果模型直接回答自己是智谱 AI 开发的 GLM 大模型。

图片

智谱的官推也来转推祝贺。

图片

业界大佬:证据指向中国开源模型

X 博主 @deedydas 认为,Cognition 的 SWE-1.5 是基于中国公司智谱的 GLM 4.6 模型进行定制(精调 / 强化学习),并运行在 Cerebras 的硬件上;Cursor 的 Composer 模型也带有中国式推理痕迹。

图片

      最新消息,cerebras 发邮件官宣,11 月 5 日推出 zai-glm-4.6 作为新编码模型,这是给实锤了?

系统架构师 Daniel Jeffries 也发帖表示,有很多证据表明 WindSurf 和 Cursor 这些新模型都是经过微调,而不是从零开始训练的,这对于开源社区来说是一个胜利。

Jeffries 进一步指出,从头开始训练一个基础模型的成本极其高昂,许多资金和计算资源更雄厚的公司都未能成功。因此,WindSurf 和 Cursor 团队选择在后期训练阶段投资强化学习是非常合逻辑的,尤其是他们已经拥有强大的数据集和大量用户编码数据,这些数据更容易进行处理。

图片

他还认为,Cursor 和 WindSurf 的团队并没有足够的资金来建设一个庞大的训练集群,也没有足够的数据和团队支持从零开始建立一个大模型。在当前,许多大型实验室已经在这一领域建立了强大的规模,单靠独立开发是无法成功的。

图片

此外,他还指出,一些反对开源的公司和个人阻碍了开源模型的发展,影响了现代软件开发和创新的进程。他呼吁美国公司意识到开源的重要性,回归开源理念,而不是发布功能受限的专有模型。

图片

目前,Jeffries 发布的这篇帖子已被 LeCun 转发,进一步引发了讨论。

网友们纷纷表示,中国的开源基础模型已经具备了足够的能力来支持西方产品的开发,这意味着全球 AI 正进入多极化竞争的新格局。

图片

有网友幽默评论道:是不是该开始学中文了?

图片

国产开源模型,已成为 AI 领域主流

10 月 29 日,英伟达 CEO 黄仁勋在华盛顿的 GTC 大会上,除了发布新 GPU,也说了一番对目前 AI 行业现状的观察。他表示开源模型已变得非常强大,大大加速了 AI 应用的进程,开发者、研究者、全球的公司都需要开源。

在老黄展示的全球开源模型的下载及采用情况图中可以看到,2025 年以来,阿里的通义千问模型(Qwen)已占据开源模型的大部分市场份额,并且领先优势还在持续扩大中,衍生模型数量也是全球第一图片

随着开源模型的推理能力、多模态能力、专业领域能力的提升,它们不仅仅在帮助开发者,甚至已成为初创公司的命脉。或许对于 Cursor 和 Cognition 来说就是这样。

除此之外,在 AI 社区 HuggingFace 的趋势榜上,排行前列的模型都出自国内公司,有 MiniMax、DeepSeek、Kimi、百度、混元、千问,还有美团的 LongCat。

图片

在第三方的基准平台 ArtificialAnalysis 上比较和分析模型质量、性能、推理速度、上下文窗口、参数数量和许可详情等性能指标,排行前列的也大多数是国产模型

图片

看起来不论是在模型技术水平与能力,还是全球开发者、科技公司的接受度上,国内开源大模型都已经确立了领先的地位,正在改变着全球 AI 领域的竞争格局。

这场大模型技术竞赛中,追赶者和领先者的身位,正在慢慢发生变化。

相关资讯

Consensus CEO 回应阿尔特曼“碾压”初创言论:从“套壳”开始也能做出伟大产品

OpenAI 就像是悬在 AI 初创公司头上的达摩克利斯之剑,可这在多大程度上是真实的,亦或是阿尔特曼的自我标榜?这篇文章击碎了科技巨头的滤镜,并试图为套壳 GPT 正名。这个时代的 AI 创业者最担心的一件事,莫过于自己的产品遭遇上「正规军」的突袭;最怕听到的一句话,恐怕是「你这个是套壳应用吧」。好一点的创业公司,等待着被收购,比如前段时间卖身谷歌的 Character.ai。运气没那么好的,则纷纷死在了 OpenAI 等 AI 巨头产品发布会的前夜,徒留下一句保命箴言警示后来者 ——不要去做巨头迟早会做的事情,
8/19/2024 2:19:51 PM
清源

沙利文发布权威报告:商汤科技GenAI技术栈市场综合能力位居国内第一

创新实力强、应用落地广,GenAI(生成式AI)技术栈领域,商汤科技位居国内榜首! 近日,权威研究机构弗若斯特沙利文(Frost & Sullivan, 简称“沙利文”)联合头豹研究院发布《2024年中国GenAI技术栈市场报告》,商汤科技在11个GenAI厂商中超越阿里云、百度智能云和华为云,增长指数和创新指数均排名国内第一,在全球排名中仅次于亚马逊云科技。 报告认为,商汤积极投入技术创新,致力于为用户提供行业领先的自研模型与高性能国产化的推理引擎,同时建立了包含机器与人工审核、安全评测与内容安全策略迭代升级等在内的完整性安全管理方案,是GenAI技术栈领域的领导者。
12/30/2024 4:09:00 PM
新闻助手

全球首个亿级参数量地震波大模型今年对外开放

全球首个亿级参数量地震波大模型“谛听”在国家超级计算机成都中心发布第三阶段测试版本,该大模型 2025 年将开放微调、推理框架和配套的数据处理流程,用户可在超算平台直接使用“谛听”用于业务分析和科学研究。
1/19/2025 1:46:30 PM
归泷(实习)
  • 1