IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线

作者：AI在线 2025-02-11 02:25

IBM 近日宣布，其 AI 开发平台 watsonx.ai 现已支持 DeepSeek-R1蒸馏版的 Llama3.18B和 Llama3.370B模型。 DeepSeek 通过知识蒸馏技术，利用 R1模型生成的数据对多个 Llama和 Qwen变体进行了优化，进一步提升了模型性能。在 watsonx.ai平台上，用户可以通过两种方式使用 DeepSeek 蒸馏模型。

IBM 近日宣布，其 AI 开发平台 watsonx.ai 现已支持 DeepSeek-R1蒸馏版的 Llama3.18B和 Llama3.370B模型。DeepSeek 通过知识蒸馏技术，利用 R1模型生成的数据对多个 Llama和 Qwen变体进行了优化，进一步提升了模型性能。

在 watsonx.ai平台上，用户可以通过两种方式使用 DeepSeek 蒸馏模型。首先，IBM 在 “按需部署”目录中提供了 Llama 蒸馏版，用户可部署专用实例以确保安全推理。其次，用户还可以通过 “自定义基础模型” 导入功能，上传 DeepSeek-R1的其他变体，例如 Qwen 蒸馏模型，从而满足多样化的应用需求。

DeepSeek

DeepSeek-R1具备强大的推理能力，适用于广泛的领域，为企业和开发者提供了高效且灵活的 AI 解决方案。此次更新进一步丰富了 watsonx.ai的模型生态系统，助力用户更便捷地开发和部署 AI 应用。

DeepSeek-R1详细解读！

DeepSeek-R1爆火，今天来详细看下。论文地址：：：：现有LLMs在推理任务上的改进主要依赖监督微调（SFT）和后训练（Post-Training）方法，但这些方法需要大量人工标注数据且成本高昂。 OpenAI的o1系列模型虽通过扩展推理链（Chain-of-Thought, CoT）提升了性能，但其测试时扩展仍存在挑战。

2/19/2025 8:00:00 AM

GoldMa

DeepSeek称遭到大规模恶意攻击，注册或受影响

DeepSeek发布公告称其线上服务近期遭受了大规模恶意攻击，导致注册过程可能变得繁忙。 DeepSeek提醒用户，如果遇到注册困难，可以稍等后重试。已注册用户可以正常登录，不受影响。

1/28/2025 10:37:00 AM

AI在线

“新神登场”，消息称 DeepSeek R2 模型有望 5 月前发布

据路透社报道，三位知情人士透露，DeepSeek 正在加速推出其 R2 人工智能模型，该公司最初计划在五月推出，但目前正在努力尽快推出。

2/25/2025 8:18:29 PM

归泷（实习）

IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线

相关资讯

DeepSeek-R1详细解读！

DeepSeek称遭到大规模恶意攻击，注册或受影响

“新神登场”，消息称 DeepSeek R2 模型有望 5 月前发布