AIGC宇宙 AIGC宇宙

美媒:一些中国大模型已经追平甚至超越美国产品

CNBC报道称,中国想在AI领域成为统治者,这种尝试可能已经获得回报。 一些美国AI业内人士和科技分析人士认为,中国AI模型已经相当流行,从性能角度看,中国的一些模型与美国产品齐头并进,甚至超越。 由于无法采购美国先进AI芯片,中国只能寻找其它办法增强AI模型性能,比如依赖开源技术,开发自主软件和芯片。

美媒:一些中国大模型已经追平甚至超越美国产品

CNBC报道称,中国想在AI领域成为统治者,这种尝试可能已经获得回报。一些美国AI业内人士和科技分析人士认为,中国AI模型已经相当流行,从性能角度看,中国的一些模型与美国产品齐头并进,甚至超越。

由于无法采购美国先进AI芯片,中国只能寻找其它办法增强AI模型性能,比如依赖开源技术,开发自主软件和芯片。

OpenAI ChatGPT是基于闭源模型开发的,但中国的许多企业选择了开源LLM。查看Hugging Face平台,下载最多的LLM有许多来自中国企业,其中阿里巴巴Qwen(通义千问)热度最高,深度求索的DeepSeek也备受推崇。

阿里Qwen、DeepSeek等中国大模型受追捧

Hugging Face机器学习工程师Tiezhen Wang告诉CNBC:“从评测基准看,Qwen的性能极为出色,这是它快速流行的主要原因。”还有,Qwen的授权模式比较友好,企业使用时法律评估没有那么复杂。

阿里巴巴给Qwen分了级,有的参数很多,更强大,但算力要求高,运行成本也高,如果是参数少的小模型,运行成本更低。

Tiezhen Wang说:“不管你选择什么规模的模型,Qwen都可能是现今性能最棒的模型之一。”

DeepSeek也成为耀眼明星,它不久前刚刚推出DeepSeek-R1模型。上个月DeepSeek发布消息称,R1模型可以与OpenAI o1模型竞争。

中国企业宣称,它们的模型可以与Meta Llama开源模型竞争,也与OpenAI等闭源模型一样好。

Lux Capital合伙人Grace Isford说:“2023年,我观察到中国对开源AI的贡献不断增加,中国模型的性能很强,成本低,吞吐量高。”

不只是中国企业支持开源LLM,Meta和欧洲创业公司Mistral也有开源版AI模型。随着中美科技竞争加剧,开源模型还有一个优势:中国企业可以将自己的模型推向全球。

全球咨询公司DGA Group的合伙人Paul Triolo说:“中国企业当然希望自己的模型能在中国之外使用,所以中国企业看重开源模型,希望借开源成为AI领域的全球性玩家。”

中国企业认为LLM会是未来科技生态系统的核心

虽然全球都在热炒AI模型,但是到底应该在模型之上开发什么应用?未来谁会主导全球互联网版图?现在还充满争论。

Grace Isford说:“如果你认为前沿基本AI模型是必需,那就应该思考这些模型的用途,比如用于前沿科学、工程技术。”

乐观者将AI模型比作操作系统,它和Windows、Android、iOS一样重要,有可能会主导市场,就像科技企业主导手机和PC一样。

英国伦敦大学国王学院学者Xin Sun认为:“中国企业认为LLM会是未来科技生态系统的核心。”

Xin Sun还说:“未来的商业模型有赖于开发者加入生态系统,要基于LLM开发新的应用,要通过各种手段吸引用户、数据并获得利润,远不只是引导用户使用云服务那么简单。”

中国构建独立于英伟达高性能AI芯片之外的基础设施

训练AI模型需要海量数据,运行时需要强大算力。英伟达已经成为AI芯片的垄断者,许多头部AI企业也用英伟达芯片训练模型,但中国是个例外。

虽然美国百般阻挠,禁止英伟达高端AI芯片流入中国,但中国企业仍然不断推出先进AI模型。

Paul Triolo说:“目前大多中国科技平台都拥有充足的算力,完全可以继续优化模型。首先,中国企业囤积了大量英伟达GPU;其次,中国有自己的GPU,它们来自华为等企业。”

实际上,中国科技企业正在开发英伟达芯片的替代品,华为是领导者,百度、阿里巴巴也在投资半导体设计。

Paul Triolo认为:“在未来的日子里,中国与美国先进硬件的差距还会拉大,特别是明年,因为明年英伟达将会推出Blackwell系统,美国会严格禁止Blackwell流向中国。”

Grace Isford认为,中国一直在向本国AI基础设施进行投资,它独立于英伟达高性能AI芯片之外。“不管美国有没有禁止英伟达AI芯片在中国销售,中国都会继续投资,继续打造自己的基础设施,继续开发、训练AI模型。”(小刀)

相关资讯

腾讯云上线DeepSeek全系API接口并打通联网搜索

腾讯云宣布完成对深度求索(DeepSeek)大模型的深度整合——正式上线DeepSeek-R1和V3原版模型的API接口,并创新性接入自研大模型知识引擎,同步开放联网搜索能力。 凭借腾讯云在推理并发和生成速率等方面的优化,用户可以获得更加稳定、安全、低门槛的使用体验。 开发者只需在云上简单三步即可实现API接口调用,并通过大模型知识引擎提供的文档解析、拆分、embedding、多轮改写等能力,灵活构建专属的AI服务。
2/8/2025 2:09:00 PM
AI在线

微信搜索接入DeepSeek大模型 称AI不会使用朋友圈聊天等信息

近日,微信宣布其搜索功能接入 DeepSeek-R1模型,目前处于灰度测试阶段。 部分用户在微信搜索框选择 AI 搜索时,可体验到 DeepSeek-R1提供的深度思考功能。 微信方面表示,引入大模型旨在提升搜索的智能化和精准度,更好地理解用户搜索意图,分析处理复杂查询。
2/19/2025 11:18:00 AM
AI在线

DeepSeek-R1 登顶 Hugging Face:以10000 赞力压 150 万个模型

今日凌晨,全球最大开源平台之一 Hugging Face 的首席执行官 Clement Delangue 在社交平台发文宣布,DeepSeek-R1在 Hugging Face 上获得了超过10000个赞,成为该平台近150万个模型中最受欢迎的大模型。 这一里程碑式的成就标志着 DeepSeek-R1在全球 AI 社区中的广泛认可与影响力。 DeepSeek-R1的崛起速度令人瞩目。
2/24/2025 9:30:00 AM
AI在线
testab