AIGC宇宙 AIGC宇宙

DeepSeek可能使用了Google Gemini数据训练新 AI 模型

近日, DeepSeek 发布了其最新的 R1推理 AI 模型更新版,该模型在多个数学和编程基准测试中展现出色性能。 然而,DeepSeek 并未透露其模型的训练数据来源,令一些 AI 研究人员产生了疑问,并推测该模型可能部分基于 Google 的 Gemini AI 系列进行训练。 墨尔本的开发者 Sam Paeach 声称,他发现 DeepSeek 的 R1-0528模型在用词和表达方式上与 Google Gemini2.5Pro 有许多相似之处。

近日, DeepSeek 发布了其最新的 R1推理 AI 模型更新版,该模型在多个数学和编程基准测试中展现出色性能。然而,DeepSeek 并未透露其模型的训练数据来源,令一些 AI 研究人员产生了疑问,并推测该模型可能部分基于 Google 的 Gemini AI 系列进行训练。

墨尔本的开发者 Sam Paeach 声称,他发现 DeepSeek 的 R1-0528模型在用词和表达方式上与 Google Gemini2.5Pro 有许多相似之处。虽然这并不能作为直接证据,但另一位开发者 —— 匿名的 SpeechMap 项目创始人 —— 也提到,DeepSeek 模型在推理过程中产生的 “思维轨迹” 与 Gemini 的表现如出一辙。这一发现再次引发了关于 DeepSeek 是否在训练中使用了竞争对手数据的讨论。

DeepSeek

图源备注:图片由AI生成,图片授权服务商Midjourney

早在去年12月,DeepSeek 就曾因其 V3模型频繁将自己标识为 OpenAI 的 ChatGPT 而受到指责,这一行为暗示该模型可能是通过 ChatGPT 的聊天记录进行训练的。今年早些时候,OpenAI 向媒体透露,发现了 DeepSeek 与 “数据蒸馏” 技术相关的证据。“数据蒸馏” 是一种通过从大型模型中提取信息来训练新模型的方法。彭博社报道称,OpenAI 的合作伙伴微软在2024年底发现,很多数据是通过 OpenAI 开发者账户泄露的,这些账户可能与 DeepSeek 有关。

尽管 “提炼” 技术在 AI 界并不罕见,但 OpenAI 明确规定禁止用户使用其模型输出构建竞争产品。需要注意的是,由于开放网络中充斥着大量低质量内容,许多 AI 模型在训练中往往会错误地模仿彼此的用词和措辞。这使得深度剖析训练数据源变得更加复杂。

人工智能专家 Nathan Lambert 认为,DeepSeek 使用 Google Gemini 的数据进行训练并非不可能。他提到,DeepSeek 拥有充足的资金,能够利用市面上最佳的 API 模型生成合成数据。为了防止数据被提炼,AI 公司们也在不断加强安全措施。例如,OpenAI 已开始要求各组织完成身份验证才能访问某些高级模型,而 Google 也在努力提高其 AI Studio 平台的安全性,限制对模型生成轨迹的访问。

相关资讯

发烧友!一国外软件工程师买下OGOpenAI.com域名并重定向至DeepSeek

最近,一位软件工程师安纳奈・阿罗拉(Ananay Arora)以 “不到一顿 Chipotle 餐” 的价格购买了域名 OGOpenAI.com,并将其重定向至中国的 AI 实验室 DeepSeek。 这个决定引发了许多人的关注,因为 DeepSeek 近期在开源 AI 领域中取得了显著进展,成为了热议的话题。 DeepSeek 发布的 AI 模型在技术上与早期的 OpenAI 模型相似,能够离线使用,并且任何具备相应硬件的开发者都可以免费使用。
1/24/2025 10:31:00 AM
AI在线

英伟达点赞DeepSeek:是“出色的人工智能进步”

国产大模型公司DeepSeek的应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,超越了ChatGPT。 这一成就不仅引起了市场的广泛关注,也对AI芯片龙头英伟达的股价产生了重大影响。 尽管如此,英伟达发言人仍然对DeepSeek给出了高度评价,称其为AI领域的一项卓越进步,并指出DeepSeek的工作展示了如何利用测试时间缩放技术、广泛可用的模型以及符合出口管制的计算资源来创建新型号。
1/28/2025 10:50:00 AM
AI在线

LG 的 Exaone AI 模型以成本效率匹敌DeepSeek

近期,美国知名研究机构 Epoch AI 发布了一份报告,正式将 LG 的 Exaone3.532B 模型评选为 “值得注意的 AI” 之一,并在成本效率方面表现尤为突出,与中国的 DeepSeek 不相上下。 LG Exaone3.5模型于2023年12月正式推出,其开发投资约为70亿韩元(约合480万美元),这一成本低于 DeepSeek 开发其 V3模型所花费的600万美元。 Epoch AI 的评估标准主要考虑了模型的性能、使用频率等因素,而这也是两年来首个获得此类认可的韩国 AI 模型,显示了 LG 在人工智能领域的突破性进展。
2/10/2025 4:52:00 PM
AI在线
  • 1