DeepSeek
摩尔线程支持 DeepSeek 开源周“全家桶”
摩尔线程宣布全面支持DeepSeek开源周的五大项目,包括FlashMLA、DeepEP、DeepGEMM、DualPipe和Fire-Flyer 文件系统(3FS)。#摩尔线程##DeepSeek开源周##DeepSeek#
3/2/2025 9:12:24 AM
归泷(实习)
DeepSeek一天能赚多少钱?官方突然揭秘V3/R1推理系统,成本全透明
DeepSeek 官方:如果所有 tokens 全部按照 DeepSeek R1 的定价计算,理论上一天的总收入为 $562,027,成本利润率 545%。 但实际上没有这么多收入,因为 V3 的定价更低,同时收费服务只占了一部分,另外夜间还会有折扣。 太突然了!
3/1/2025 9:10:00 PM
机器之心
官方详解 DeepSeek-V3 / R1 推理系统:优化目标是更大吞吐、更低延迟
DeepSeek 官方今日在知乎发布《DeepSeek-V3 / R1 推理系统概览》一文,详细介绍如何使用大规模跨节点专家并行(Expert Parallelism / EP)来增大 batch size、如何隐藏传输的耗时、如何进行负载均衡。
3/1/2025 12:56:50 PM
清源
“腾讯元宝电脑版”正式发布:混元大模型 / DeepSeek 双模切换,支持 AI 搜索、总结、写作等核心能力
腾讯元宝电脑版正式上线,支持Windows和macOS系统,集成了混元大模型和DeepSeek大模型,提供AI搜索、总结、写作等核心功能。此外,还能解析多种格式文档,并融入腾讯文档、电脑管家等生态产品,提升工作效率。#腾讯元宝##AI助手#
3/1/2025 12:39:46 PM
漾仔
DeepSeek 反思潮:AGI 既被重新审视,又被持续低估
2 月很有意思。 一、DeepSeek 反思潮在 DeepSeek 的集体反思潮中,无论是大厂内部的“AGI 创业团队”、还是 AGI 的明星创业公司,都进行了战略调整。 很显然,DeepSeek 的暴击让整个行业都进行了一次深刻的反思,值得注意的几个变化是:首先,大模型创业公司重新将技术突破提升到一个新的高度、超越产品更新成为公司战略发展的优先级。
2/28/2025 11:45:00 PM
陈彩娴
清华 + 北大两部 DeepSeek 原版宝典新出炉!(附九部全集下载)
对了,这次给大家分享的 PDF 下载,是原汁原味的原版哦,网上有太多卖课者魔改的内置其广告版本。
2/28/2025 8:05:45 PM
泓澄
如何安全地使用第三方应用程序访问DeepSeek
译者 | 张哲刚审校 | 重楼AI编码助手改变了开发人员编写软件的方式。 它们可以自动执行重复性的任务,及早发现错误,进而加快开发进度。 但是,并不是所有的AI 编码工具在构建时都考虑到了安全性这个重要的问题。
2/28/2025 5:03:43 PM
张哲刚
阿里国际 AI 搜索引擎 Accio 成功接入 DeepSeek
阿里国际 AI 搜索引擎 Accio 宣布接入 DeepSeek,进一步提升其在全球市场的搜索能力。 这一新举措不仅为用户提供了更为精准的信息检索服务,还为企业和开发者打开了全新的合作机会。 Accio 作为阿里巴巴旗下的国际搜索引擎,致力于利用人工智能技术为全球用户提供快速、准确的信息查询服务。
2/28/2025 4:10:00 PM
AI在线
DeepSeek 只有 160 名员工:新希望董事长刘永好透露与梁文锋交谈内容,称赞年轻人更懂新的科技
刘永好称:“DeepSeek 梁同学,这次开会我们又在一块吃饭,我就问他,我说你现在有多少员工,他说 160 个。我说你现在那么大的影响,做那么多事才 160 个?他说是。”
2/28/2025 2:37:46 PM
汪淼
转战 AI 课程直播!“嘎子哥”谢孟伟开卖DeepSeek课程
在直播热潮中,曾因主演《小兵张嘎》而广受欢迎的演员 “嘎子哥” 谢孟伟,也选择直播赛道。 继之前销售白酒后,他将目光投向了人工智能领域,推出了名为 DeepSeek 的 AI 课程。 在直播中,嘎子哥向观众介绍了 DeepSeek 课程的内容。
2/28/2025 2:11:00 PM
AI在线
DeepSeek太给力了!自家的大模型秘方开源到底!国产大模型雄起
出品 | 51CTO技术栈(微信号:blog51cto)DeepSeek “开源周”第五天,依旧保持了一如既往地“务实”风,满满的诚意。 先来回忆下前四天,源神的慷慨发布——第一天,2月24日,最为外界称道的MLA技术率先开源,这项解码加速器FlashMLA技术能够让英伟达Hopper架构GPU跑得更快,效果更好! 紧接着,25日,直接亮出首个面向MoE模型的开源专家并行通信库DeepEP,实现了MoE训练推理的全栈优化;第三天,则进一步祭出一项跨时代的发布:FP8通用矩阵乘法加速库,从底层让模型训练、微调变得更加流畅丝滑;第四天,也就是昨天的并行优化“三剑客”:DeepSeek-V3和R1 模型背后的并行计算优化技术——DualPipe(双向流水线并行算法,让计算和通信高效协同)、EPLB ( 专家并行负载均衡器,让每个 GPU 都“雨露均沾”)、profile-data (性能分析数据,可以理解成V3/R1 的并行优化的分析经验)可以说前四天的发布聚焦在算力通信、模型架构优化,也就是算力和算法的层面,而接下来第五天的开源则补上了AI三驾马车的最后一块,也是用户体验感知更为明显的一块优化动作:高性能分布式文件系统(数据存储层面的改进)。
2/28/2025 12:32:42 PM
DeepSeek开源周最后一天:让数据处理「从自行车升级到高铁」
DeepSeek 的开源周终于迎来了最后一天。 今天他们开源了一个名为 3FS(Fire-Flyer File System)的系统。 这是一种并行文件系统,它利用现代固态硬盘(SSD)和远程直接内存访问(RDMA)网络的全部带宽,能够加速和推动 DeepSeek 平台上所有数据访问操作。
2/28/2025 10:36:25 AM
机器之心
DeepSeek 开源进度 5/5:高性能并行文件系统 3FS 实现聚合吞吐 6.6 TiB/s
2 月 28 日消息,DeepSeek 在开源周第五天发布了 3FS(Fire-Flyer File . System),这是一个专为充分利用现代 SSD 和 RDMA . 网络带宽而设计的并行文件系统,具备惊人的数据访问性能,为深度学习等数据密集型应用提供了强大的支持。
2/28/2025 10:01:06 AM
故渊
“嘎子哥”谢孟伟开卖 AI 课,宣称 DeepSeek 引爆流量
随着生成式 AI 行业以及国产 DeepSeek 模型的爆火,直播带货行业也开始向 AI 靠拢。2 月 26 日有网友发布视频,曾主演《小兵张嘎》的演员“嘎子哥”谢孟伟有了新的直播方向。
2/28/2025 9:38:06 AM
汪淼
疯了!居然有人试图让我搞懂,什么是 DeepGEMM
DeepSeek开源周,继DeepEP之后,开源了第三弹DeepGEMM。 今天简单来说说:吃瓜:DeepGMEE是干嘛的? 技术:DeepGMEE是怎么做到的?
2/28/2025 9:30:00 AM
58沈剑
DeepSeek“出圈”了,鹅厂人怎么看?
话题背景在人工智能领域,大型语言模型的快速发展引发了无数关于技术革新和未来趋势的讨论。 随着各类AI技术的不断突破,越来越多的创新模型开始崭露头角,而最近备受关注的DeepSeek更是成为了热议的焦点。 它被一些人称为“AI技术的重大突破”,甚至被认为是下一代人工智能发展的重要方向。
2/28/2025 9:00:00 AM
腾讯技术工程
摩尔线程成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe
在 DeepSeek 开源周第四日,摩尔线程宣布已成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe,并发布相关开源代码仓库:MT-DeepEP 和 MT-DualPipe。
2/27/2025 11:39:00 PM
归泷(实习)
网友拿DeepSeek当赛博华佗,是觉得自己的命够硬吗?
AI好好用报道编辑:杨文把命交给DeepSeek,这届网友的胆子是真大。 前两天,我闲来无事躺床上刷热搜,刷到一个热搜词条:AI 用几滴血预测百种病。 就是抽几滴血,然后医生用 AI 算法,对着血液里近 3000 种蛋白质的变化一通分析,就能预测疾病。
2/27/2025 9:18:00 PM
AI好好用
资讯热榜
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
ChatGPT 语音功能升级,实时翻译对话更自然流畅
长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试
谷歌 Gemini 应用月下载量超越 ChatGPT,用户活跃度仍显不足
苹果将 ChatGPT 和其他 AI 模型引入 Xcode
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
数据
谷歌
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
开发者
蛋白质
腾讯
神经网络
研究
3D
生成
训练
苹果
计算
智能体
Sora
机器学习
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
大语言模型
xAI
预测
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
Copilot
算力
工具
LLM
驾驶
API
大型语言模型
应用
RAG
亚马逊