理论

分析一下EP并行和DeepSeek开源的DeepEP代码

被好几个团队的人追着要渣B来分析一下DeepEP的工作, 公司内外的团队都有...简单的一句话说, 非常棒的工作,很多细节都值得学习. 但是还有一些硬件上的缺陷, 在DeepSeek-V3的论文中提出的建议要结合在一起看就会更清楚了. 我们还是由浅入深来谈谈EP并行, 并进一步分析一下这份出色的工作.

2/27/2025 9:06:34 AM

渣B

当DeepSeek遇见RFID，如何重塑零售业的未来

作者 | 涂承烨审校 | 重楼随着科技的不断进步，射频识别技术（RFID）已成为现代零售业不可或缺的一部分。 RFID通过无线信号传输数据，实现对物品的追踪和管理。尽管传统的RFID系统已经在一定程度上提高了零售业的运营效率，但仍存在一些局限性。

2/27/2025 8:41:08 AM

涂承烨

你可能还不知道的四个 ChatGPT 新功能

过去几个月里，ChatGPT 的功能更新可以说让人目不暇接，这里总结了 4 个最近的重量级功能，绝对值得你马上尝试。 Deep ResearchDeep Research 让 ChatGPT 能像一个真正的“研究员”一样通过浏览器进行多层次的链式搜索。它不会只抓取一个结果，而是能顺藤摸瓜，制订计划并调整搜索思路，真正深入挖掘信息。

2/27/2025 8:33:13 AM

dev

探索基于Qwen2.5实现DeepSeek推理的奇妙之旅

作为一名互联网技术爱好者，我一直对大型语言模型和高效推理技术充满热情。本文基于基于Qwen2.5实现DeepSeek推理功能。本文使用unsloth框架，这个轻量高效、易于上手的工具，加上SFT中文数据集的加持，测试了在医疗领域的推理应用。

2/27/2025 8:00:00 AM

DeepSeek R2要提前发布！这是有关R2的几个传闻：100%国产算力部署！能耗降低25%，多模态模型！

DeepSeek 今天有两个大新闻：一个是开源了自家用于助力V3/R1模型训练与推理的一个FP8通用矩阵乘法 (GEMM) 加速库，这一块相信不少业内人士会感兴趣，据悉性能高达1350 TFLOPS，进一步揭秘了为什么现在的DeepSeek可以吐字这么流畅，训练和计算成本为什么如此低廉。不过更为让人震惊的，相信还是第二个：DeepSeek原定于要5月初发布的DeepSeek R2，现在正在争取提前甚至尽可能早的发布！这一提前发布R2的消息，是路透社当地时间周二发布的，路透社跟三位知情人士了解到：DeepSeek原本计划在5月初发布R2，但现在希望尽早发布，但没有提供具体细节。

2/26/2025 2:51:00 PM

研究：英国高校逾九成本科生借助 AI 完成作业

2 月 26 日消息，据英国《卫报》今日报道，一项针对 1000 名学生的调查显示，在过去 12 . 个月里，生成式人工智能的使用呈现“爆炸性增长”。在 2025 年的调查中，接近九成（88%）的学生表示，他们会在评估中使用像 ChatGPT .

2/26/2025 2:24:43 PM

清源

手把手演示 IDEA 如何接入 DeepSeek，你学会了吗？

本文介绍如何在 IntelliJ IDEA 中集成 DeepSeek , 并展示如何利用它来提升开发效率。 1.安装 CodeGPT 插件图片在插件市场里，搜索 CodeGPT ，安装即可。假如网络安装慢，可以从插件下载地址，直接下载。

2/26/2025 10:31:35 AM

勇哥

DeepSeek开源第三弹：惊人的300行代码驱动R1和V3的训练与推理，超越各种专家内核

DeepSeek开源周第三弹！ DeepSeek-AI 重磅发布高效FP8 GEMM库 DeepGEMM：极致性能，代码精简，助力V3/R1模型训练与推理！简单来说这是由 DeepSeek-AI 团队精心打造的 FP8 通用矩阵乘法 (GEMM) 加速库，专为追求极致性能和代码简洁而生我们一起来扒一扒：Hopper GPU 上狂飙 1350 FP8 TFLOPS！

2/26/2025 10:11:01 AM

AI寒武纪

DeepSeek高阶提示词编写思路-从原则到方法技能

Hello，大家好，我是人月聊IT。在前面文章我曾经谈到过。在我们使用GPT的时候的，当时有一个标准的提示词模版，即：角色：让GPT扮演什么角色技能：GPT需要具备哪些关键的技能目标：输出的目标是什么约束：有哪些工具约束，过程约束等在原有的这个提示词模版中，最难的往往是技能描述。

2/26/2025 1:00:00 AM

何明璐

微软急刹车，被曝撤掉大波数据中心租赁！DeepSeek冲击，算力泡沫要破？

一个月内，微软市值已暴跌了3171亿美元，时间点正好是从DeepSeek在华尔街掀起风暴开始。而就在刚刚，根据Bloomberg透露，作为OpenAI的最大支持者，微软已经取消了部分AI数据中心的租赁。具体来说，微软在美国至少与两家私人运营商取消了协议，总计取消了「数百兆瓦」的租赁，相当于大约两个数据中心。

2/25/2025 1:00:00 PM

新智元

业界首个“混合AI推理模型”！快OpenAI一步Anthropic跳版本发布：Claude3.7 Sonnet可自行决定思考时长

整理 | 星璇出品 | 51CTO技术栈（微信号：blog51cto）就在OpenAI还在吊胃口之际，最强竞对 Anthropic 深夜开大了！ Anthropic 直接把自家的“通用推理”二合一的模型发布了，并把自家内部在用的AI编程工具也上线，直接可以终端执行任务的那种！这就带大家看看这家公司在大模型以及AI产品上的不同打法！

2/25/2025 11:59:44 AM

星璇

OpenAI研究人员发现，AI无法解决大多数编程问题

2月24日消息，据外媒报道，OpenAI的研究人员承认，即使是最先进的AI模型仍然无法与人类程序员匹敌，尽管首席执行官山姆·奥特曼(Sam Altman)坚称，到今年年底，他们将能够击败“低级”的软件工程师。在一篇新论文中，该公司的研究人员发现，即使是前沿模型，或最先进、最具突破边界的人工智能系统，“仍然无法解决大多数”编码任务。研究人员使用了一种名为sw-lancer的新开发基准，该基准基于自由职业者网站Upwork的1400多个软件工程任务。

2/25/2025 10:21:12 AM

DeepSeek，2025 最值得学习十个 Vue3 库源码？

VueUse - 组合式API工具集GitHub: ，提供 200 组合式 API 函数。其模块化架构和TypeScript 类型系统堪称典范，适合学习如何组织大型工具类项目。源码中可重点研究 useStorage 的状态同步机制和 useEventListener 的事件管理设计2.

2/25/2025 8:51:19 AM

前端之神

DeepSeek R1 满血版来了，完全不卡！

前言最近DeepSeek爆火。我之前也发过多篇关于DeepSeek的文章，推荐大家使用它。今年是AI的一个风口。

2/25/2025 8:20:50 AM

苏三

五分钟，构建国产数据库智能体

近期，圈里很多朋友，都尝试利用 DeepSeek 构建自己的智能体。我也利用腾讯元器，将个人公众号内容做了个智能体，可以实现简单的问答。那么延展来看，智能体除了可利用公众号内容，也可使用离线文件等方式来构建。

2/25/2025 7:49:36 AM

DeepSeek一夜把百度干回20年前，网友：还有这好事？

没完了，刚刚接入DeepSeek的百度，又双叒叕搞事情了。最新消息，“百度一下你就知道”这条2005年开始伴随着中国用户度过了互联网黄金岁月的Slogan，回归了。有意思的是，这种“炒冷饭”的行为在大厂中已经出现了人传人的现象。

2/24/2025 2:20:00 PM

量子位

多行业拥抱DeepSeek，全不顾它身上的“刺”

在数字化浪潮席卷全球的今天，技术革命的脚步正以指数级速率重构人类社会发展轨迹。而DeepSeek的出现，毫无疑问重塑了商业世界的运行法则——从产业上游的芯片制造到终端消费者的移动支付，从医疗影像的毫厘级诊断到教育资源的跨时空共享，算法与数据的交织已然突破想象力的边界。当下，众多产业正在与人工智能产生"化学反应"，这种由技术创新引发的链式反应，正在三百六十度解构既有行业秩序，催生出"生产力跃迁2.0"时代的全新商业生态。

2/24/2025 2:15:16 PM

科技云报到

DeepSeek开源周“第一刀”砍向算力！重磅开源FlashMLA，挑战H800算力极限，网友直呼：极致的工程设计！

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）上周五，DeepSeek刚刚预告了重磅开源周！周一一早，DeepSeek就履行承诺，开源了针对 Hopper GPU 的高效 MLA 解码内核——FlashMLA！图片根据DeepSeek介绍，FlashMLA内核针对变长序列进行了优化，是已投入生产的核心技术。

2/24/2025 12:52:46 PM

伊风

资讯热榜

印度创新试点：AI 聊天机器人助力电子商务购物新方式两部门联合发布《政务领域人工智能大模型部署应用指引》大力推动AI技术应用软银贷款50亿美元助力AI投资，孙正义押注未来科技！马斯克 xAI 在孟菲斯开建全球最大污水处理厂，年节约饮用水达 190 亿升前DeepMind大神创业一年估值飙至80亿美元：Reflection AI要做美国版DeepSeek OpenAI新研究称GPT-5为迄今“政治偏见最少”的AI模型 Sora2公布提示词指南！直接抄作业能玩一整天！ OpenAI Sora 引爆 App Store“山寨潮”:30万次下载!苹果审核机制遭质疑

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画机器人数据大模型 Midjourney 开源 Meta 智能微软用户 AI新词 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练论文代码 LLM 算法 Stable Diffusion 芯片腾讯 AI for Science 苹果 Agent Claude 蛋白质开发者生成式神经网络 xAI 机器学习 3D 研究人形机器人生成 AI视频百度工具 RAG 大语言模型 Sora 华为 GPU 计算具身智能 AI设计字节跳动搜索大型语言模型 AGI 场景深度学习视频生成架构预测视觉伟达 DeepMind Transformer 编程神器推荐 AI模型亚马逊 MCP