AIGC宇宙 AIGC宇宙

IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线

IBM 近日宣布,其 AI 开发平台 watsonx.ai 现已支持 DeepSeek-R1蒸馏版的 Llama3.18B和 Llama3.370B模型。 DeepSeek 通过知识蒸馏技术,利用 R1模型生成的数据对多个 Llama和 Qwen变体进行了优化,进一步提升了模型性能。 在 watsonx.ai平台上,用户可以通过两种方式使用 DeepSeek 蒸馏模型。

IBM 近日宣布,其 AI 开发平台 watsonx.ai 现已支持 DeepSeek-R1蒸馏版的 Llama3.18B和 Llama3.370B模型。DeepSeek 通过知识蒸馏技术,利用 R1模型生成的数据对多个 Llama和 Qwen变体进行了优化,进一步提升了模型性能。

在 watsonx.ai平台上,用户可以通过两种方式使用 DeepSeek 蒸馏模型。首先,IBM 在 “按需部署”目录中提供了 Llama 蒸馏版,用户可部署专用实例以确保安全推理。其次,用户还可以通过 “自定义基础模型” 导入功能,上传 DeepSeek-R1的其他变体,例如 Qwen 蒸馏模型,从而满足多样化的应用需求。

DeepSeek

DeepSeek-R1具备强大的推理能力,适用于广泛的领域,为企业和开发者提供了高效且灵活的 AI 解决方案。此次更新进一步丰富了 watsonx.ai的模型生态系统,助力用户更便捷地开发和部署 AI 应用。

相关资讯

基于 DeepSeek 大模型,河南引入“AI 智审”系统实现货物口岸通关申报“秒级”筛查

AI在线 7 月 25 日消息,据新华网报道,河南省现已为货物口岸通关引入一项“AI 智审”系统,相应系统基于 DeepSeek 大模型开发,可对企业合规性数据申报内容实现“秒级”筛查。 AI在线参考相应报道获悉,“AI 智审”自今年 4 月 24 日上线试运行以来极大降低了企业出海门槛,已累计筛查报关单 76 万次,企业端、海关端审核效率分别提高约 34% 和 70%。 新华网援引郑州航空港区一家刚开展进出口业务的企业反馈,在“AI 智审”的帮助下,企业通关申报差错减少 60% 以上,申报效率大幅提高。
7/25/2025 4:16:02 PM
漾仔

DeepSeek-R1详细解读!

DeepSeek-R1爆火,今天来详细看下。 论文地址::::现有LLMs在推理任务上的改进主要依赖监督微调(SFT)和后训练(Post-Training)方法,但这些方法需要大量人工标注数据且成本高昂。 OpenAI的o1系列模型虽通过扩展推理链(Chain-of-Thought, CoT)提升了性能,但其测试时扩展仍存在挑战。
2/19/2025 8:00:00 AM
GoldMa

DeepSeek称遭到大规模恶意攻击,注册或受影响

DeepSeek发布公告称其线上服务近期遭受了大规模恶意攻击,导致注册过程可能变得繁忙。 DeepSeek提醒用户,如果遇到注册困难,可以稍等后重试。 已注册用户可以正常登录,不受影响。
1/28/2025 10:37:00 AM
AI在线
  • 1