理论
分析一下EP并行和DeepSeek开源的DeepEP代码
被好几个团队的人追着要渣B来分析一下DeepEP的工作, 公司内外的团队都有...简单的一句话说, 非常棒的工作,很多细节都值得学习. 但是还有一些硬件上的缺陷, 在DeepSeek-V3的论文中提出的建议要结合在一起看就会更清楚了. 我们还是由浅入深来谈谈EP并行, 并进一步分析一下这份出色的工作.
2/27/2025 9:06:34 AM
渣B
当DeepSeek遇见RFID,如何重塑零售业的未来
作者 | 涂承烨审校 | 重楼随着科技的不断进步,射频识别技术(RFID)已成为现代零售业不可或缺的一部分。 RFID通过无线信号传输数据,实现对物品的追踪和管理。 尽管传统的RFID系统已经在一定程度上提高了零售业的运营效率,但仍存在一些局限性。
2/27/2025 8:41:08 AM
涂承烨
你可能还不知道的四个 ChatGPT 新功能
过去几个月里,ChatGPT 的功能更新可以说让人目不暇接,这里总结了 4 个最近的重量级功能,绝对值得你马上尝试。 Deep ResearchDeep Research 让 ChatGPT 能像一个真正的“研究员”一样通过浏览器进行多层次的链式搜索。 它不会只抓取一个结果,而是能顺藤摸瓜,制订计划并调整搜索思路,真正深入挖掘信息。
2/27/2025 8:33:13 AM
dev
探索基于Qwen2.5实现DeepSeek推理的奇妙之旅
作为一名互联网技术爱好者,我一直对大型语言模型和高效推理技术充满热情。 本文基于基于Qwen2.5实现DeepSeek推理功能。 本文使用unsloth框架,这个轻量高效、易于上手的工具,加上SFT中文数据集的加持,测试了在医疗领域的推理应用。
2/27/2025 8:00:00 AM
DeepSeek R2要提前发布!这是有关R2的几个传闻:100%国产算力部署!能耗降低25%,多模态模型!
DeepSeek 今天有两个大新闻:一个是开源了自家用于助力V3/R1模型训练与推理的一个FP8通用矩阵乘法 (GEMM) 加速库,这一块相信不少业内人士会感兴趣,据悉性能高达1350 TFLOPS,进一步揭秘了为什么现在的DeepSeek可以吐字这么流畅,训练和计算成本为什么如此低廉。 不过更为让人震惊的,相信还是第二个:DeepSeek原定于要5月初发布的DeepSeek R2,现在正在争取提前甚至尽可能早的发布! 这一提前发布R2的消息,是路透社当地时间周二发布的,路透社跟三位知情人士了解到:DeepSeek原本计划在5月初发布R2,但现在希望尽早发布,但没有提供具体细节。
2/26/2025 2:51:00 PM
研究:英国高校逾九成本科生借助 AI 完成作业
2 月 26 日消息,据英国《卫报》今日报道,一项针对 1000 名学生的调查显示,在过去 12 . 个月里,生成式人工智能的使用呈现“爆炸性增长”。 在 2025 年的调查中,接近九成(88%)的学生表示,他们会在评估中使用像 ChatGPT .
2/26/2025 2:24:43 PM
清源
手把手演示 IDEA 如何接入 DeepSeek,你学会了吗?
本文介绍如何在 IntelliJ IDEA 中集成 DeepSeek , 并展示如何利用它来提升开发效率 。 1.安装 CodeGPT 插件图片在插件市场里,搜索 CodeGPT ,安装即可。 假如网络安装慢,可以从插件下载地址,直接下载。
2/26/2025 10:31:35 AM
勇哥
DeepSeek开源第三弹:惊人的300行代码驱动R1和V3的训练与推理,超越各种专家内核
DeepSeek开源周第三弹! DeepSeek-AI 重磅发布高效FP8 GEMM库 DeepGEMM:极致性能,代码精简,助力V3/R1模型训练与推理! 简单来说这是由 DeepSeek-AI 团队精心打造的 FP8 通用矩阵乘法 (GEMM) 加速库,专为追求极致性能和代码简洁而生我们一起来扒一扒:Hopper GPU 上狂飙 1350 FP8 TFLOPS!
2/26/2025 10:11:01 AM
AI寒武纪
DeepSeek高阶提示词编写思路-从原则到方法技能
Hello,大家好,我是人月聊IT。 在前面文章我曾经谈到过。 在我们使用GPT的时候的,当时有一个标准的提示词模版,即:角色:让GPT扮演什么角色技能:GPT需要具备哪些关键的技能目标:输出的目标是什么约束:有哪些工具约束,过程约束等在原有的这个提示词模版中,最难的往往是技能描述。
2/26/2025 1:00:00 AM
何明璐
微软急刹车,被曝撤掉大波数据中心租赁!DeepSeek冲击,算力泡沫要破?
一个月内,微软市值已暴跌了3171亿美元,时间点正好是从DeepSeek在华尔街掀起风暴开始。 而就在刚刚,根据Bloomberg透露,作为OpenAI的最大支持者,微软已经取消了部分AI数据中心的租赁。 具体来说,微软在美国至少与两家私人运营商取消了协议,总计取消了「数百兆瓦」的租赁,相当于大约两个数据中心。
2/25/2025 1:00:00 PM
新智元
业界首个“混合AI推理模型”!快OpenAI一步Anthropic跳版本发布:Claude3.7 Sonnet可自行决定思考时长
整理 | 星璇出品 | 51CTO技术栈(微信号:blog51cto)就在OpenAI还在吊胃口之际,最强竞对 Anthropic 深夜开大了! Anthropic 直接把自家的“通用 推理”二合一的模型发布了,并把自家内部在用的AI编程工具也上线,直接可以终端执行任务的那种! 这就带大家看看这家公司在大模型以及AI产品上的不同打法!
2/25/2025 11:59:44 AM
星璇
OpenAI研究人员发现,AI无法解决大多数编程问题
2月24日消息,据外媒报道,OpenAI的研究人员承认,即使是最先进的AI模型仍然无法与人类程序员匹敌,尽管首席执行官山姆·奥特曼(Sam Altman)坚称,到今年年底,他们将能够击败“低级”的软件工程师。 在一篇新论文中,该公司的研究人员发现,即使是前沿模型,或最先进、最具突破边界的人工智能系统,“仍然无法解决大多数”编码任务。 研究人员使用了一种名为sw-lancer的新开发基准,该基准基于自由职业者网站Upwork的1400多个软件工程任务。
2/25/2025 10:21:12 AM
Yu
DeepSeek,2025 最值得学习十个 Vue3 库源码?
VueUse - 组合式API工具集GitHub: ,提供 200 组合式 API 函数。 其模块化架构和TypeScript 类型系统堪称典范,适合学习如何组织大型工具类项目。 源码中可重点研究 useStorage 的状态同步机制和 useEventListener 的事件管理设计2.
2/25/2025 8:51:19 AM
前端之神
DeepSeek R1 满血版来了,完全不卡!
前言最近DeepSeek爆火。 我之前也发过多篇关于DeepSeek的文章,推荐大家使用它。 今年是AI的一个风口。
2/25/2025 8:20:50 AM
苏三
五分钟,构建国产数据库智能体
近期,圈里很多朋友,都尝试利用 DeepSeek 构建自己的智能体。 我也利用腾讯元器,将个人公众号内容做了个智能体,可以实现简单的问答。 那么延展来看,智能体除了可利用公众号内容,也可使用离线文件等方式来构建。
2/25/2025 7:49:36 AM
DeepSeek一夜把百度干回20年前,网友:还有这好事?
没完了,刚刚接入DeepSeek的百度,又双叒叕搞事情了。 最新消息,“百度一下 你就知道”这条2005年开始伴随着中国用户度过了互联网黄金岁月的Slogan,回归了。 有意思的是,这种“炒冷饭”的行为在大厂中已经出现了人传人的现象。
2/24/2025 2:20:00 PM
量子位
多行业拥抱DeepSeek,全不顾它身上的“刺”
在数字化浪潮席卷全球的今天,技术革命的脚步正以指数级速率重构人类社会发展轨迹。 而DeepSeek的出现,毫无疑问重塑了商业世界的运行法则——从产业上游的芯片制造到终端消费者的移动支付,从医疗影像的毫厘级诊断到教育资源的跨时空共享,算法与数据的交织已然突破想象力的边界。 当下,众多产业正在与人工智能产生"化学反应",这种由技术创新引发的链式反应,正在三百六十度解构既有行业秩序,催生出"生产力跃迁2.0"时代的全新商业生态。
2/24/2025 2:15:16 PM
科技云报到
DeepSeek开源周“第一刀”砍向算力!重磅开源FlashMLA,挑战H800算力极限,网友直呼:极致的工程设计!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)上周五,DeepSeek刚刚预告了重磅开源周! 周一一早,DeepSeek就履行承诺,开源了针对 Hopper GPU 的高效 MLA 解码内核——FlashMLA! 图片根据DeepSeek介绍,FlashMLA内核针对变长序列进行了优化,是已投入生产的核心技术。
2/24/2025 12:52:46 PM
伊风
资讯热榜
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
ChatGPT 语音功能升级,实时翻译对话更自然流畅
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
谷歌 Gemini 应用月下载量超越 ChatGPT,用户活跃度仍显不足
苹果将 ChatGPT 和其他 AI 模型引入 Xcode
“程序员炸锅”!Claude一夜撤离 Windsurf,OpenAI 收购遭"精准狙击"
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
数据
谷歌
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
开发者
蛋白质
腾讯
神经网络
研究
3D
生成
训练
苹果
计算
智能体
Sora
机器学习
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
大语言模型
xAI
预测
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
LLM
Copilot
算力
工具
驾驶
API
大型语言模型
应用
RAG
亚马逊