DeepSeek

另一个来自中国本土"DeepSeek"时刻？全球首个通用人工智能代理发布

I 圈又炸了锅！另一个来自中国本土"DeepSeek"时刻今天，Manus AI 悄悄憋了一年的大招终于揭开了神秘面纱——通用AI Agent「Manus」正式发布早期预览版！这可不是市面上那些只能跟你聊天的“智能聊天机器人”的升级版，而是一个真正意义上的自主智能体，它最大的亮点在于：打通了从想法到执行的完整链路！

3/7/2025 10:12:16 AM

AI寒武纪

FP8 训练新范式：减少 40% 显存占用，训练速度提高 1.4 倍

近期DeepSeek V3 引爆国内外的社交媒体，他们在训练中成功应用了 FP8 精度，显著降低了 GPU 内存使用和计算开销。这表明，FP8 量化技术在优化大型模型训练方面正发挥着越来越重要的作用。近期，来自伯克利，英伟达，MIT 和清华的研究者们提出了显存高效的 FP8 训练方法：COAT（Compressing Optimizer states and Activation for Memory-Efficient FP8 Training），致力于通过 FP8 量化来压缩优化器状态和激活值，从而提高内存利用率和训练速度。

3/7/2025 10:02:10 AM

机器之心

重磅开源！基于 Spring Boot 的企业级 DeepSeek 知识库与智能对话方案

本项目基于 Spring Boot 3.4 构建，旨在打造一款高效、智能的企业级知识库与智能对话平台，充分集成 DeepSeek 大语言模型，以支持企业级私有化部署和智能客服应用。项目目标该方案通过整合 DeepSeek 强大的自然语言处理能力，实现高效、精准的对话交互，同时支持企业知识库的管理，助力企业构建智能化的客户支持与内部知识共享体系。技术架构后端基于 Spring Boot 3.4 开发，提供 RESTful API 以处理业务逻辑，并与 DeepSeek 模型进行高效交互。

3/7/2025 7:57:56 AM

路条编程

手把手教学！Deepseek Janus 生图模型安装流程+核心功能解析

一、Janus 模型介绍. Janus 是深度求索（DeepSeek）公司开源的多模态大模型，主打 AI 图像生成与 AI 图像识别，支持文生图、图生文等多模态交互，属于其 AGI 技术布局中的关键产品之一。（简而言之：一个能画图、能识图、开源可定制的 AI 模型）.

3/7/2025 1:56:33 AM

果汁

10个章节帮你快速入门DeepSeek

一、DeepSeek 是什么？ DeepSeek 是一款基于人工智能的通用型助手工具，能够通过自然语言交互提供信息检索、数据分析、创意生成等服务。其核心特点包括：知识广度与深度：覆盖从日常生活到学术研究的多个领域，知识储备相当于大学毕业生水平，部分领域可达研究生水平。

3/7/2025 12:01:26 AM

果汁

Manus创始人肖弘：90后AI新星比前辈梁文峰年轻

一款名为Manus的通用AI代理产品席卷全球科技圈，其背后创始人肖弘（英文名Red）成为备受瞩目的焦点人物。公开资料显示，Manus创始人肖弘是一名90后，1992年出生，比DeepSeek创始人梁文峰（1985年出生）年轻7岁。这位华中科技大学软件工程专业毕业的年轻创业者，以敏锐的洞察力和卓越的执行力，在AI领域崭露头角，成为中国科技界的新星。

3/6/2025 3:00:28 PM

AI在线

我用DeepSeek做了一个AI获客工具

其实去年我就有做AI获客的想法了。当时帮一个外贸公司做过自动分析客户级别以及自动生成邮件的项目，了解到他们对获取客户的需求非常迫切。他们通常从谷歌浏览器、会展名单以及海关数据中获取客户信息，但是整个过程非常耗时。

3/6/2025 1:10:32 PM

贝塔街的万事屋

32B逆袭671BDeepSeek R1！阿里推理模型炸翻了：小到笔记本就能run,成本仅1/10！又是强化学习带来惊喜！

编辑 | 伊风太震撼了。阿里直接扔了一张王炸！ QwQ-32B，一个参数量如此小的小模型，居然追平了671B的DeepSeek-R1？

3/6/2025 12:43:03 PM

伊风

利用DeepSeek人工智能和人工智能可解释性预防银行欺诈

分析人工智能驱动的欺诈检测使用XGBoost、SHAP和实时仪表板提高了准确性和透明度，提供了可扩展的解决方案来打击欺诈。随着人工智能（AI）和机器学习（ML）的发展，银行业的欺诈检测取得了显著进展。然而，一个持续存在的挑战是欺诈决策的可解释性——我们如何证明为什么一个特定的交易被标记为欺诈？

3/6/2025 11:35:18 AM

Harris编译

从DeepSeek看IT行业的未来：如何通过智能搜索技术提升企业竞争力

作者 | 涂承烨审校 | 重楼引言：智能搜索技术的颠覆性革命2025年，中国AI企业DeepSeek凭借其开源大模型DeepSeek-R1的横空出世，在全球AI领域掀起了一场技术革命。这款模型的发布不仅标志着中国在AI技术上的自主突破，更以“低成本、高性能、开源开放”的特性重构了企业应用AI的范式。其上线仅21天即突破2215万日活跃用户（DAU），超越ChatGPT登顶苹果应用商店下载榜，这背后不仅是技术的胜利，更是企业智能化转型需求爆发的缩影。

3/6/2025 8:00:00 AM

涂承烨

3秒出结果！如何用DeepSeek把用户差评变成设计方案？

用户差评往往是体验优化的起点。面对 DeepSeek 这样强大的 AI，不禁让我思考：它真的能帮设计师从吐槽中提取有效建议吗？这些建议能真正落地吗？

3/6/2025 7:40:53 AM

团队58UXD

大模型系列：DeepSeek大模型与应用场景介绍

今天给大家聊聊DeepSeek 究竟有哪些强大的模型？这些模型又适用于哪些具体的场景呢？希望对大家了解 DeepSeek 大模型提供一些参考。

3/6/2025 7:28:31 AM

郝光明

全球首次！2B复现DeepSeek-R1「啊哈时刻」，UCLA等用纯RL实现多模态推理

就在刚刚，我们在未经监督微调的2B模型上，见证了基于DeepSeek-R1-Zero方法的视觉推理「啊哈时刻」！这一成就，再次让AI社区轰动。博客地址：：，能成功扩展到多模态推理领域吗？

3/6/2025 1:00:00 AM

新智元

我用 Claude Sonnet 和 DeepSeek R1 开发一个同样的工具，看谁更厉害！

先给 DeepSeek 泼一盆冷水，DeepSeek 在编程能力上和 Claude Sonnet 还是差了一大截的。下面有使用 Sonnet 3.5 和 DeepSeek R1 配合 Trae 实现一个推文生成图片卡片小插件的过程，功能虽小，但还是能看出差距的。这两天 Trae 不是推出了国内版吗（），搭载豆包和 DeepSeek 大模型，因为之前 Trae 国际版是支持 Claude Sonnet 的，最开始是 3.5，后来 Claude 升级了 3.7，隔了一天 Trae 就跟进了，而且也是完全免费的。

3/6/2025 12:22:00 AM

风筝

DeepSeek+Drawio一键生成20多种图表，90%都不知道的技巧（附保姆级教程）

大家好，我是岳哥。 DeepSeek目前还不支持直接画图，但是我们借助一些第三方工具，还是可以达到生成图表的效果。今天继续给大家分享工作中的流程图，甘特图，统计图，如何通过DeepSeek来生成。

3/6/2025 12:08:00 AM

、平凡世界

看完清北看浙大，DeepSeek 宝典一网打尽（附 12 部全集下载）

这次，IT之家为大家找到了浙大出品的两份 DeepSeek 宝典，还外加清华沈阳团队的新攻略，一共三份武林秘籍。

3/5/2025 8:04:33 PM

泓澄

4400万打水漂？马斯克阻止OpenAI营利化惨遭驳回！将秋季开庭判决；法官：收购提议太双标了！

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）马斯克4告OpenAI的连续剧，又有新进展了！前情回顾下，马斯克与OpenAI对簿公堂是因为：他曾向非营利组织OpenAI捐赠超过4400万美元，而OpenAI的营利化转型，显然违反了当时的合同。这都不是4400万打了水漂那么简单！

3/5/2025 6:38:28 PM

伊风

冯远征用 DeepSeek 写剧本：语言都很严谨，但可能缺少人的温度

随着 AI 大模型助手的大热，关于 AI 和艺术创作的讨论就一直没有停歇，传奇导演蒂姆・波顿（Tim Burton）曾称 AI 生成的艺术“非常令人不安”。#政协委员冯远征用DeepSeek写剧本#

3/5/2025 4:07:06 PM

汪淼

资讯热榜

6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享 AI玩拼图游戏暴涨视觉理解力，告别文本中心训练，无需标注的多模态大模型后训练范式 OpenAI 为 ChatGPT 推出智能记忆清理功能，Plus 用户率先体验大的来了：谷歌Gemini 3.0 Pro单次生成网页版操作系统，Win、Mac、Linux一网打尽 AI圈重磅发布！九大章节深度解读313页的State of AI 2025报告大模型降本增效，稀疏注意力机制的魔力在哪？英国政府提出 AI 节省 450 亿英镑计划，但专家质疑其可行性实测，Claude Code 配合国内大模型，一样很牛x（完整配置教程）

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画机器人数据大模型 Midjourney 开源 Meta 智能微软用户 AI新词 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练论文 LLM 代码算法芯片 Stable Diffusion 苹果腾讯 AI for Science Agent Claude 蛋白质开发者生成式神经网络 xAI 机器学习 3D 研究人形机器人生成 AI视频百度大语言模型 Sora 工具 GPU 具身智能 RAG 华为计算字节跳动 AI设计搜索 AGI 大型语言模型场景视频生成深度学习架构 DeepMind 视觉预测 Transformer 伟达编程 AI模型特斯拉生成式AI 神器推荐