AIGC宇宙 AIGC宇宙

理论

分析一下EP并行和DeepSeek开源的DeepEP代码

被好几个团队的人追着要渣B来分析一下DeepEP的工作, 公司内外的团队都有...简单的一句话说, 非常棒的工作,很多细节都值得学习. 但是还有一些硬件上的缺陷, 在DeepSeek-V3的论文中提出的建议要结合在一起看就会更清楚了. 我们还是由浅入深来谈谈EP并行, 并进一步分析一下这份出色的工作.
2/27/2025 9:06:34 AM
渣B

当DeepSeek遇见RFID,如何重塑零售业的未来

作者 | 涂承烨审校 | 重楼随着科技的不断进步,射频识别技术(RFID)已成为现代零售业不可或缺的一部分。 RFID通过无线信号传输数据,实现对物品的追踪和管理。 尽管传统的RFID系统已经在一定程度上提高了零售业的运营效率,但仍存在一些局限性。
2/27/2025 8:41:08 AM
涂承烨

你可能还不知道的四个 ChatGPT 新功能

过去几个月里,ChatGPT 的功能更新可以说让人目不暇接,这里总结了 4 个最近的重量级功能,绝对值得你马上尝试。 Deep ResearchDeep Research 让 ChatGPT 能像一个真正的“研究员”一样通过浏览器进行多层次的链式搜索。 它不会只抓取一个结果,而是能顺藤摸瓜,制订计划并调整搜索思路,真正深入挖掘信息。
2/27/2025 8:33:13 AM
dev

探索基于Qwen2.5实现DeepSeek推理的奇妙之旅

作为一名互联网技术爱好者,我一直对大型语言模型和高效推理技术充满热情。 本文基于基于Qwen2.5实现DeepSeek推理功能。 本文使用unsloth框架,这个轻量高效、易于上手的工具,加上SFT中文数据集的加持,测试了在医疗领域的推理应用。
2/27/2025 8:00:00 AM

DeepSeek R2要提前发布!这是有关R2的几个传闻:100%国产算力部署!能耗降低25%,多模态模型!

DeepSeek 今天有两个大新闻:一个是开源了自家用于助力V3/R1模型训练与推理的一个FP8通用矩阵乘法 (GEMM) 加速库,这一块相信不少业内人士会感兴趣,据悉性能高达1350 TFLOPS,进一步揭秘了为什么现在的DeepSeek可以吐字这么流畅,训练和计算成本为什么如此低廉。 不过更为让人震惊的,相信还是第二个:DeepSeek原定于要5月初发布的DeepSeek R2,现在正在争取提前甚至尽可能早的发布! 这一提前发布R2的消息,是路透社当地时间周二发布的,路透社跟三位知情人士了解到:DeepSeek原本计划在5月初发布R2,但现在希望尽早发布,但没有提供具体细节。
2/26/2025 2:51:00 PM

研究:英国高校逾九成本科生借助 AI 完成作业

2 月 26 日消息,据英国《卫报》今日报道,一项针对 1000 名学生的调查显示,在过去 12 . 个月里,生成式人工智能的使用呈现“爆炸性增长”。 在 2025 年的调查中,接近九成(88%)的学生表示,他们会在评估中使用像 ChatGPT .
2/26/2025 2:24:43 PM
清源

手把手演示 IDEA 如何接入 DeepSeek,你学会了吗?

本文介绍如何在 IntelliJ IDEA 中集成 DeepSeek , 并展示如何利用它来提升开发效率 。 1.安装 CodeGPT 插件图片在插件市场里,搜索 CodeGPT ,安装即可。 假如网络安装慢,可以从插件下载地址,直接下载。
2/26/2025 10:31:35 AM
勇哥

DeepSeek开源第三弹:惊人的300行代码驱动R1和V3的训练与推理,超越各种专家内核

DeepSeek开源周第三弹! DeepSeek-AI 重磅发布高效FP8 GEMM库 DeepGEMM:极致性能,代码精简,助力V3/R1模型训练与推理! 简单来说这是由 DeepSeek-AI 团队精心打造的 FP8 通用矩阵乘法 (GEMM) 加速库,专为追求极致性能和代码简洁而生我们一起来扒一扒:Hopper GPU 上狂飙 1350 FP8 TFLOPS!
2/26/2025 10:11:01 AM
AI寒武纪

DeepSeek高阶提示词编写思路-从原则到方法技能

Hello,大家好,我是人月聊IT。 在前面文章我曾经谈到过。 在我们使用GPT的时候的,当时有一个标准的提示词模版,即:角色:让GPT扮演什么角色技能:GPT需要具备哪些关键的技能目标:输出的目标是什么约束:有哪些工具约束,过程约束等在原有的这个提示词模版中,最难的往往是技能描述。
2/26/2025 1:00:00 AM
何明璐

微软急刹车,被曝撤掉大波数据中心租赁!DeepSeek冲击,算力泡沫要破?

一个月内,微软市值已暴跌了3171亿美元,时间点正好是从DeepSeek在华尔街掀起风暴开始。 而就在刚刚,根据Bloomberg透露,作为OpenAI的最大支持者,微软已经取消了部分AI数据中心的租赁。 具体来说,微软在美国至少与两家私人运营商取消了协议,总计取消了「数百兆瓦」的租赁,相当于大约两个数据中心。
2/25/2025 1:00:00 PM
新智元

业界首个“混合AI推理模型”!快OpenAI一步Anthropic跳版本发布:Claude3.7 Sonnet可自行决定思考时长

整理 | 星璇出品 | 51CTO技术栈(微信号:blog51cto)就在OpenAI还在吊胃口之际,最强竞对 Anthropic 深夜开大了! Anthropic 直接把自家的“通用 推理”二合一的模型发布了,并把自家内部在用的AI编程工具也上线,直接可以终端执行任务的那种! 这就带大家看看这家公司在大模型以及AI产品上的不同打法!
2/25/2025 11:59:44 AM
星璇

OpenAI研究人员发现,AI无法解决大多数编程问题

2月24日消息,据外媒报道,OpenAI的研究人员承认,即使是最先进的AI模型仍然无法与人类程序员匹敌,尽管首席执行官山姆·奥特曼(Sam Altman)坚称,到今年年底,他们将能够击败“低级”的软件工程师。 在一篇新论文中,该公司的研究人员发现,即使是前沿模型,或最先进、最具突破边界的人工智能系统,“仍然无法解决大多数”编码任务。 研究人员使用了一种名为sw-lancer的新开发基准,该基准基于自由职业者网站Upwork的1400多个软件工程任务。
2/25/2025 10:21:12 AM
Yu

DeepSeek,2025 最值得学习十个 Vue3 库源码?

VueUse - 组合式API工具集GitHub: ,提供 200 组合式 API 函数。 其模块化架构和TypeScript 类型系统堪称典范,适合学习如何组织大型工具类项目。 源码中可重点研究 useStorage 的状态同步机制和 useEventListener 的事件管理设计2.
2/25/2025 8:51:19 AM
前端之神

DeepSeek R1 满血版来了,完全不卡!

前言最近DeepSeek爆火。 我之前也发过多篇关于DeepSeek的文章,推荐大家使用它。 今年是AI的一个风口。
2/25/2025 8:20:50 AM
苏三

五分钟,构建国产数据库智能体

近期,圈里很多朋友,都尝试利用 DeepSeek 构建自己的智能体。 我也利用腾讯元器,将个人公众号内容做了个智能体,可以实现简单的问答。 那么延展来看,智能体除了可利用公众号内容,也可使用离线文件等方式来构建。
2/25/2025 7:49:36 AM

DeepSeek一夜把百度干回20年前,网友:还有这好事?

没完了,刚刚接入DeepSeek的百度,又双叒叕搞事情了。 最新消息,“百度一下 你就知道”这条2005年开始伴随着中国用户度过了互联网黄金岁月的Slogan,回归了。 有意思的是,这种“炒冷饭”的行为在大厂中已经出现了人传人的现象。
2/24/2025 2:20:00 PM
量子位

多行业拥抱DeepSeek,全不顾它身上的“刺”

在数字化浪潮席卷全球的今天,技术革命的脚步正以指数级速率重构人类社会发展轨迹。 而DeepSeek的出现,毫无疑问重塑了商业世界的运行法则——从产业上游的芯片制造到终端消费者的移动支付,从医疗影像的毫厘级诊断到教育资源的跨时空共享,算法与数据的交织已然突破想象力的边界。 当下,众多产业正在与人工智能产生"化学反应",这种由技术创新引发的链式反应,正在三百六十度解构既有行业秩序,催生出"生产力跃迁2.0"时代的全新商业生态。
2/24/2025 2:15:16 PM
科技云报到

DeepSeek开源周“第一刀”砍向算力!重磅开源FlashMLA,挑战H800算力极限,网友直呼:极致的工程设计!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)上周五,DeepSeek刚刚预告了重磅开源周! 周一一早,DeepSeek就履行承诺,开源了针对 Hopper GPU 的高效 MLA 解码内核——FlashMLA! 图片根据DeepSeek介绍,FlashMLA内核针对变长序列进行了优化,是已投入生产的核心技术。
2/24/2025 12:52:46 PM
伊风