理论

Phi-4-multimodal：图、文、音频统一的多模态大模型架构、训练方法、数据细节

Phi-4-Multimodal 是一种参数高效的多模态模型，通过 LoRA 适配器和模式特定路由器实现文本、视觉和语音/音频的无缝集成。训练过程包括多阶段优化，确保在不同模式和任务上的性能，数据来源多样，覆盖高质量合成数据。它的设计体现了小型语言模型在多模态任务上的潜力。

3/10/2025 2:00:00 AM

余俊晖

最新版DeepSeek保姆喂饭级安装教程：本地部署+避坑指南（升级版）

本文旨在提供一个全面且详细的DeepSeek本地部署指南，帮助大家在自己的设备上成功运行DeepSeek模型。无论你是AI领域的初学者还是经验丰富的开发者，都能通过本文的指导，轻松完成DeepSeek的本地部署。一、本地部署的适用场景DeepSeek本地部署适合以下场景：高性能硬件配置：如果你的电脑配置较高，特别是拥有独立显卡和足够的存储空间，那么本地部署将能充分利用这些硬件资源。

3/10/2025 12:00:00 AM

冰河

Manus是智能体的"DeepSeek时刻"？DeepSeek本尊怎么看？

Manus从一夜爆火到一码难求，市场开始出现不同的声音。支持者认为，Manus是智能体的"DeepSeek时刻"；反对者认为，Manus是一场精心策划的“炒作”。 Manus成色究竟如何，不妨来听听作为对标对象的DeepSeek的回答。

3/10/2025 12:00:00 AM

极客AI

二次增长！ChatGPT周活用户数据翻倍到2亿！一文梳理OpenAI的流量暴涨之路。DeepSeek紧随其后！

知名风险投资公司 Andreessen Horowitz (a16z) 周四刚刚发布了新报告。报告显示，OpenAI 旗下的聊天机器人ChatGPT在 2024 年下半年恢复了稳健增长。报告发现，ChatGPT 用了 9 个月的时间从 2023 年 11 月的每周 1 亿活跃用户增长到 2024 年 8 月的 2 亿，但现在该应用程序只用了不到六个月的时间就再次将这一数字翻了一番。

3/7/2025 12:04:07 PM

小时级部署交付，分钟级AI应用构建，这款火山引擎AI一体机如何做到的？

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）当前，DeepSeek的推出为企业智能化转型带来新的想象空间。然而，想要短期内快速用好DeepSeek来服务企业自身的业务场景，绝非易事。最为明显的一个现象是：没有进行整体的应用规划而直接本地部署DeepSeek，一旦接入实际的业务场景和数据，往往会导致效果不达预期，甚至适得其反。

3/7/2025 11:47:56 AM

云昭

如何在本地部署 DeepSeek 并提供接口用于开发AI对话应用?

最近，DeepSeek 异常火爆，堪称国产 AI 之光，并且它还是免费开源的。只需打开 DeepSeek 对话界面，就能免费与其对话，让它解决你的问题，关键是它的回答质量非常高。当然，本篇文章并不是介绍如何使用 DeepSeek 进行对话的，因为这太简单了，连我 5 岁的儿子都会用。

3/7/2025 10:36:21 AM

东方小月

另一个来自中国本土"DeepSeek"时刻？全球首个通用人工智能代理发布

I 圈又炸了锅！另一个来自中国本土"DeepSeek"时刻今天，Manus AI 悄悄憋了一年的大招终于揭开了神秘面纱——通用AI Agent「Manus」正式发布早期预览版！这可不是市面上那些只能跟你聊天的“智能聊天机器人”的升级版，而是一个真正意义上的自主智能体，它最大的亮点在于：打通了从想法到执行的完整链路！

3/7/2025 10:12:16 AM

AI寒武纪

FP8 训练新范式：减少 40% 显存占用，训练速度提高 1.4 倍

近期DeepSeek V3 引爆国内外的社交媒体，他们在训练中成功应用了 FP8 精度，显著降低了 GPU 内存使用和计算开销。这表明，FP8 量化技术在优化大型模型训练方面正发挥着越来越重要的作用。近期，来自伯克利，英伟达，MIT 和清华的研究者们提出了显存高效的 FP8 训练方法：COAT（Compressing Optimizer states and Activation for Memory-Efficient FP8 Training），致力于通过 FP8 量化来压缩优化器状态和激活值，从而提高内存利用率和训练速度。

3/7/2025 10:02:10 AM

机器之心

如何理解模型的蒸馏和量化

在LLM领域内，经常会听到两个名词：蒸馏和量化。这代表了LLM两种不同的技术，它们之间有什么区别呢？本次我们就来详细聊一下。

3/7/2025 8:00:00 AM

重磅开源！基于 Spring Boot 的企业级 DeepSeek 知识库与智能对话方案

本项目基于 Spring Boot 3.4 构建，旨在打造一款高效、智能的企业级知识库与智能对话平台，充分集成 DeepSeek 大语言模型，以支持企业级私有化部署和智能客服应用。项目目标该方案通过整合 DeepSeek 强大的自然语言处理能力，实现高效、精准的对话交互，同时支持企业知识库的管理，助力企业构建智能化的客户支持与内部知识共享体系。技术架构后端基于 Spring Boot 3.4 开发，提供 RESTful API 以处理业务逻辑，并与 DeepSeek 模型进行高效交互。

3/7/2025 7:57:56 AM

路条编程

我用DeepSeek做了一个AI获客工具

其实去年我就有做AI获客的想法了。当时帮一个外贸公司做过自动分析客户级别以及自动生成邮件的项目，了解到他们对获取客户的需求非常迫切。他们通常从谷歌浏览器、会展名单以及海关数据中获取客户信息，但是整个过程非常耗时。

3/6/2025 1:10:32 PM

贝塔街的万事屋

32B逆袭671BDeepSeek R1！阿里推理模型炸翻了：小到笔记本就能run,成本仅1/10！又是强化学习带来惊喜！

编辑 | 伊风太震撼了。阿里直接扔了一张王炸！ QwQ-32B，一个参数量如此小的小模型，居然追平了671B的DeepSeek-R1？

3/6/2025 12:43:03 PM

伊风

利用DeepSeek人工智能和人工智能可解释性预防银行欺诈

分析人工智能驱动的欺诈检测使用XGBoost、SHAP和实时仪表板提高了准确性和透明度，提供了可扩展的解决方案来打击欺诈。随着人工智能（AI）和机器学习（ML）的发展，银行业的欺诈检测取得了显著进展。然而，一个持续存在的挑战是欺诈决策的可解释性——我们如何证明为什么一个特定的交易被标记为欺诈？

3/6/2025 11:35:18 AM

Harris编译

离谱！OpenAI被曝博士级AI智能体2万美元/月，网友：DeepSeek快把价格打下去

什么样的AI，值得你花20000刀一个月？ OpenAI告诉你：用我们的博士级AI智能体吧，它保管值！今天这个消息，让所有人瞠目结舌：OpenAI的高管们计划发布三类智能体产品，价格分几档，最贵的一档月费高达2万美金。

3/6/2025 11:31:10 AM

新智元

OpenAI计划推2万美元包月的博士级智能体，你愿意买单吗？

近日，OpenAI计划推出一款“博士级研究智能体”，每月收费高达2万美元（约合人民币14.5万元），引发了科技界的广泛关注。这款智能体旨在处理学术研究和软件开发中的复杂任务，其强大的处理能力和深度学习算法，将为用户提供前所未有的服务体验。 OpenAI试水高端智能体OpenAI此次推出的博士级智能体并非单一产品，而是其AI智能体产品线中的高端版本。

3/6/2025 10:47:02 AM

小菲