DeepSeek
DeepSeek推出后,移动端AI风向要变
或许下一波 AI 创新,不是比谁的模型更大,而是比谁的模型离你更近。 DeepSeek R1 正在对整个科技领域产生巨大影响,颠覆人们有关 AI 的认知。 在移动端,革新正在快速发生。
3/3/2025 9:07:00 PM
机器之心
万字梳理:揭秘 DeepSeek 中的 RL 与 AGI 下一步丨AIR 2025
在 DeepSeek 能够破圈而出的一众原因中,完全摒弃传统的监督微调(SFT)、转而采用大规模强化学习(RL)的创新之处是关键所在,这使得模型推理能力在质上取得显著突破,更证明了强化学习在提升大语言模型推理能力方面的巨大潜力。 近几年,学界和业界关于 RL 和 LLM 也涌现出了颇多具备开创性意义的研究成果。 在 AI 智能体推理与决策研讨会(AIR 2025)上,来自伦敦大学学院、加州大学伯克利分校、普林斯顿大学、华盛顿大学、卡内基梅隆大学、Meta、华为等多位学术界和工业界的研究人员围绕强化学习、推理决策、AI 智能体展开讨论,回答了诸多问题,例如:AI 系统如何模拟类人推理和决策过程?
3/3/2025 8:26:00 PM
王悦
中信特钢成功接入 DeepSeek-R1 大模型,推进数字化转型
中信特钢在数字化转型领域迈出了重要一步,近日在互动平台上宣布已成功接入 DeepSeek-R1大模型。 公司表示,未来将致力于推动数字技术与实体经济的深度融合,以此为基础进行全方位的改革,力求加快构建数据资产并挖掘数据的潜在价值。 中信特钢在推进智能运维方面的努力,是企业在激烈市场竞争中的一项战略举措。
3/3/2025 5:57:00 PM
AI在线
大模型是一场新的搜索战争,OpenAI不会赢家通吃,一家最好被收购!硅谷知名投资人曝料特朗普希望马斯克更积极裁撤美政府预算
编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)最近DeepSeek开源周带来了很多惊喜与热议。 但小编发现大家对于马斯克的Grok3的讨论却远远不够充分。 作为“大模型球赛”的最不可捉摸的强大力量,马斯克的xAI最新模型已经上线,便迅速登顶了iPhone的下载排行榜,引起的轰动同样不可小觑。
3/3/2025 12:59:39 PM
言征
字节跳动AI编程产品Trae国内版发布 配置豆包1.5pro、满血版DeepSeek模型
2025年3月3日,中国首款AI原生集成开发环境(AI IDE)Trae国内版正式上线。 该产品由字节跳动技术团队推出,旨在为开发者提供更高效、智能化的编程体验。 Trae国内版配置了Doubao-1.5-pro,并支持切换满血版DeepSeek R1、V3模型,能够显著提升编程速度,助力开发者应对复杂技术挑战。
3/3/2025 11:19:00 AM
AI在线
DeepSeek开源周第六天:极致推理优化系统,提高GPU计算效率
在人工智能(AI)技术快速发展的今天,DeepSeek 团队推出了其全新的 DeepSeek-V3/R1推理系统。 这一系统旨在通过更高的吞吐量和更低的延迟,推动 AGI(通用人工智能)的高效发展。 为了实现这一目标,DeepSeek 采用了跨节点专家并行(Expert Parallelism,EP)技术,显著提高了 GPU 的计算效率,并在降低延迟的同时,扩展了批处理规模。
3/3/2025 9:45:00 AM
AI在线
官方详解 DeepSeek-V3 / R1 推理系统:理论利润率达 545%
3 月 1 日消息,DeepSeek 官方今日在知乎发布《DeepSeek-V3 / R1 . 推理系统概览》一文,详细介绍如何使用大规模跨节点专家并行(Expert Parallelism / EP)来增大 batch . size,如何隐藏传输的耗时,如何进行负载均衡。
3/3/2025 9:00:00 AM
清源
DeepSeek突袭公布成本利润率:545%
五连开源后,DeepSeek还有One More Thing! 就在刚刚,DeepSeek官方亲自揭秘了DeepSeek-V3/R1推理系统。 重点包括,优化吞吐量和延迟的方法:跨节点EP驱动的批量扩展计算与通信重叠负载均衡还公布了DeepSeek的在线服务数据统计:每个H800节点每秒有73.7k/14.8k个输入/输出token成本利润率545%更多细节,一起来看官方原文↓更大的吞吐,更低的延迟DeepSeek-V3/R1推理系统的优化目标是:更大的吞吐,更低的延迟。
3/3/2025 8:21:00 AM
量子位
DeepSeek全面开源V3/R1推理系统!成本利润率高达545%
就在刚刚,当大家以为开源周已经结束的时候,真「Open AI」DeepSeek带来了压轴大戏——DeepSeek-V3/R1推理系统,全面揭秘! 吞吐量和延迟优化:跨节点高效并行(EP)驱动的批处理扩展计算与通信并行处理智能负载均衡在线服务性能数据:每个H800节点每秒处理73,700/14,800输入/输出token成本利润率高达545�epSeek表示,希望本周分享的技术见解能为开源社区带来价值,共同推进通用人工智能的发展目标。 看到这里,网友都惊了!
3/3/2025 8:17:00 AM
新智元
分享五个在微信中使用 DeepSeek 的方法,建议收藏!
前言今天大姚将为大家分享5种在微信中使用DeepSeek的方法,帮助大家更好地利用这一工具,提升工作和学习效率。 无论是处理文档、管理知识,还是进行深度搜索和思考,这些方法都将为你带来全新的体验。 让我们一起探索DeepSeek在微信中的无限可能吧!
3/3/2025 8:06:39 AM
大姚
DeepSeek+Xmind一键生成思维导图
大家好,我是岳哥。 我们工作和生活中,有时候遇到一本好书或者是别人写的一些比较有深度的文章,认真看完要花不少时间。 但是如果我们让DeepSeek帮我们看完,提取书籍或文章中的重点内容并生成思维导图,那就效率多了。
3/3/2025 3:35:00 AM
丶平凡世界
DeepSeek第五弹炸裂收官!开源全新并行文件系统,榨干SSD全部带宽
DeepSeek开源周,今日正式收官! 内容依旧惊喜且重磅,直接公开了V3和R1训练推理过程中用到的文件系统。 具体来说,包括以下两项内容:Fire-Flyer文件系统(简称3FS,第三个F代表File),一种利用现代SSD和RDMA网络的全部带宽的并行文件系统;Smallpond,基于3FS和DuckDB构建的轻量级数据处理框架。
3/3/2025 2:00:00 AM
绝了超简单!3分钟用满血DeepSeek R1开发一款AI智能客服,零代码轻松接入微信、公众号、小程序,新手也能快速上手!
大家好,我是狂师。 在当今数字化时代,智能客服已成为提升用户体验、提高运营效率的关键工具。 今天,我们将为大家带来一个超级简单的教程,教你如何在短短3分钟内,利用腾讯微搭平台,将满血 DeepSeek R1接入到微信、公众号、小程序,打造属于自己的 AI 智能客服,哪怕你是新手也能轻松上手!
3/3/2025 12:25:00 AM
狂师
DeepSeek 官方推出的提示词库,AI内容生成的精准导航仪!
前言在当今数字化时代,人工智能(AI)正以前所未有的速度改变着我们的生活方式和工作模式。 从简单的数据处理到复杂的创意生成,AI技术正逐渐渗透到各个领域,成为推动社会进步的重要力量。 然而,如何高效地利用AI技术进行内容创作,一直是许多用户面临的难题。
3/3/2025 12:25:00 AM
大姚
三分钟部署自己的 DeepSeek R1 满血版,彻底告别服务器繁忙!
Hello,大家好,我是 Sunday。 网上有很多教大家部署 DeepSeek 的教程,但是大多数都是 小模型 部署,参数最多也就给你打到 14b。 这样的小模型相比满血版的 R1 简直 弱爆了。
3/3/2025 12:04:00 AM
程序员Sunday
问同一个问题 DeepSeek-r1 / Grok-3 / Gemini 2.0 / ChatGPT 的结果出乎意料...
最近在写 TS ,希望实现一个类似 .gitignore 的功能,已有代码如下:复制在 JS 层面使用正则匹配,显然不是什么好方案。 于是整理代码和报错信息,找了四个免费的模型,问问思路。 先说结论:DeepSeek-r1 思考了 298 秒,我一度以为其陷入了死循环,但最后其在第一轮给出的方案,被 Grok-3 、 Gemini 2.0 、 ChatGPT 统统认可是最优方案之一。
3/3/2025 12:00:00 AM
piperliu
腾讯元宝电脑版正式发布,支持Windows和macOS系统
腾讯AI助手"腾讯元宝"近日正式推出电脑版应用,同时支持Windows和macOS两大主流操作系统,进一步拓展其在桌面端的服务能力。 此次发布的电脑版专为工作和学习场景打造,旨在帮助用户减轻工作负担、提升效率。 电脑版保留了移动端和网页版的核心功能,用户可以体验到相同的智能对话能力,既可通过DeepSeek-R1满血版和推理模型混元T1进行深度思考,也能借助DeepSeek-V3和腾讯混元Turbo S快速获取答案,满足不同场景需求。
3/2/2025 10:34:00 AM
AI在线
DeepSeek揭秘:AI推理系统背后的545%惊人利润率
DeepSeek在知乎开设官方账号,发布了《DeepSeek-V3/R1推理系统概览》技术文章,首次详细披露其模型推理系统的优化细节和成本利润率信息,标志着备受关注的"DeepSeek开源周"正式结束。 文章介绍了DeepSeek-V3/R1推理系统的两大优化目标:"更大的吞吐,更低的延迟"。 为实现这些目标,DeepSeek采用了大规模跨节点专家并行(EP)技术,尽管这增加了系统复杂性。
3/2/2025 10:26:00 AM
AI在线
资讯热榜
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
ChatGPT 语音功能升级,实时翻译对话更自然流畅
肝了30小时,Flux Kontext是我用过最稳、最能干活的AI图像模型!
谷歌 Gemini 应用月下载量超越 ChatGPT,用户活跃度仍显不足
长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
数据
谷歌
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
开发者
蛋白质
腾讯
神经网络
研究
3D
生成
训练
苹果
计算
智能体
Sora
机器学习
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
大语言模型
xAI
预测
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
Copilot
算力
工具
LLM
驾驶
API
大型语言模型
应用
RAG
亚马逊