AIGC宇宙 AIGC宇宙

文章列表

官方详解 DeepSeek-V3 / R1 推理系统:理论利润率达 545%

3 月 1 日消息,DeepSeek 官方今日在知乎发布《DeepSeek-V3 / R1 . 推理系统概览》一文,详细介绍如何使用大规模跨节点专家并行(Expert Parallelism / EP)来增大 batch . size,如何隐藏传输的耗时,如何进行负载均衡。
3/3/2025 9:00:00 AM
清源

DeepSeek突袭公布成本利润率:545%

五连开源后,DeepSeek还有One More Thing! 就在刚刚,DeepSeek官方亲自揭秘了DeepSeek-V3/R1推理系统。 重点包括,优化吞吐量和延迟的方法:跨节点EP驱动的批量扩展计算与通信重叠负载均衡还公布了DeepSeek的在线服务数据统计:每个H800节点每秒有73.7k/14.8k个输入/输出token成本利润率545%更多细节,一起来看官方原文↓更大的吞吐,更低的延迟DeepSeek-V3/R1推理系统的优化目标是:更大的吞吐,更低的延迟。
3/3/2025 8:21:00 AM
量子位

DeepSeek全面开源V3/R1推理系统!成本利润率高达545%

就在刚刚,当大家以为开源周已经结束的时候,真「Open AI」DeepSeek带来了压轴大戏——DeepSeek-V3/R1推理系统,全面揭秘! 吞吐量和延迟优化:跨节点高效并行(EP)驱动的批处理扩展计算与通信并行处理智能负载均衡在线服务性能数据:每个H800节点每秒处理73,700/14,800输入/输出token成本利润率高达545�epSeek表示,希望本周分享的技术见解能为开源社区带来价值,共同推进通用人工智能的发展目标。 看到这里,网友都惊了!
3/3/2025 8:17:00 AM
新智元

分享五个在微信中使用 DeepSeek 的方法,建议收藏!

前言今天大姚将为大家分享5种在微信中使用DeepSeek的方法,帮助大家更好地利用这一工具,提升工作和学习效率。 无论是处理文档、管理知识,还是进行深度搜索和思考,这些方法都将为你带来全新的体验。 让我们一起探索DeepSeek在微信中的无限可能吧!
3/3/2025 8:06:39 AM
大姚

5分钟顶人类8小时!OpenAI Deep Research订阅全推送,端到端强化微调是关键

Deep Research(深度研究)是继「Operator」之后,OpenAI推出的第二个智能体,利用模型的推理能力,综合分析浩瀚的互联网信息,从而完成复杂的研究任务。 月初,OpenAI首先向ChatGPT Pro用户开放了Deep Research功能。 最近,进一步开放给了更多等级的订阅用户。
3/3/2025 8:02:00 AM
新智元

GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河

自从OpenAI发布GPT-4.5之后,Ilya这张图又开始火了。 GPT-4.5令人失望的表现,再次印证了Ilya这句话的含金量:预训练已经达到极限,推理Scaling才是未来有希望的范式。 GPT-4.5在基准测试上并没有提升,推理没有增强,只是变成了一个更易于合作、更有创造性、幻觉更少的模型。
3/3/2025 8:00:00 AM
新智元

DeepSeek+Xmind一键生成思维导图

大家好,我是岳哥。 我们工作和生活中,有时候遇到一本好书或者是别人写的一些比较有深度的文章,认真看完要花不少时间。 但是如果我们让DeepSeek帮我们看完,提取书籍或文章中的重点内容并生成思维导图,那就效率多了。
3/3/2025 3:35:00 AM
丶平凡世界

C#实战:基于腾讯云大模型知识引擎原子能力提供的文档解析API快速提取图片信息为MD文档

今天借助腾讯云大模型知识引擎原子能力提供的文档解析API快速提取图片信息为MD文档的WinFomr应用小案例,感兴趣的朋友可以看一下! 一、大模型知识引擎 LKE介绍官方介绍:大模型知识引擎(LLM Knowledge Engine),是面向企业客户及合作伙伴的,基于大模型的应用构建平台,结合企业专属数据,更快更高效地搭建Agent、RAG、工作流等多种模式应用,推动大语言模型在企业中的应用落地。 图片大模型知识引擎 LKE: 如何开通服务?
3/3/2025 2:00:00 AM
郝光明

DeepSeek第五弹炸裂收官!开源全新并行文件系统,榨干SSD全部带宽

DeepSeek开源周,今日正式收官! 内容依旧惊喜且重磅,直接公开了V3和R1训练推理过程中用到的文件系统。 具体来说,包括以下两项内容:Fire-Flyer文件系统(简称3FS,第三个F代表File),一种利用现代SSD和RDMA网络的全部带宽的并行文件系统;Smallpond,基于3FS和DuckDB构建的轻量级数据处理框架。
3/3/2025 2:00:00 AM

绝了超简单!3分钟用满血DeepSeek R1开发一款AI智能客服,零代码轻松接入微信、公众号、小程序,新手也能快速上手!

大家好,我是狂师。 在当今数字化时代,智能客服已成为提升用户体验、提高运营效率的关键工具。 今天,我们将为大家带来一个超级简单的教程,教你如何在短短3分钟内,利用腾讯微搭平台,将满血 DeepSeek R1接入到微信、公众号、小程序,打造属于自己的 AI 智能客服,哪怕你是新手也能轻松上手!
3/3/2025 12:25:00 AM
狂师

DeepSeek 官方推出的提示词库,AI内容生成的精准导航仪!

前言在当今数字化时代,人工智能(AI)正以前所未有的速度改变着我们的生活方式和工作模式。 从简单的数据处理到复杂的创意生成,AI技术正逐渐渗透到各个领域,成为推动社会进步的重要力量。 然而,如何高效地利用AI技术进行内容创作,一直是许多用户面临的难题。
3/3/2025 12:25:00 AM
大姚

三分钟部署自己的 DeepSeek R1 满血版,彻底告别服务器繁忙!

Hello,大家好,我是 Sunday。 网上有很多教大家部署 DeepSeek 的教程,但是大多数都是 小模型 部署,参数最多也就给你打到 14b。 这样的小模型相比满血版的 R1 简直 弱爆了。
3/3/2025 12:04:00 AM
程序员Sunday

问同一个问题 DeepSeek-r1 / Grok-3 / Gemini 2.0 / ChatGPT 的结果出乎意料...

最近在写 TS ,希望实现一个类似 .gitignore 的功能,已有代码如下:复制在 JS 层面使用正则匹配,显然不是什么好方案。 于是整理代码和报错信息,找了四个免费的模型,问问思路。 先说结论:DeepSeek-r1 思考了 298 秒,我一度以为其陷入了死循环,但最后其在第一轮给出的方案,被 Grok-3 、 Gemini 2.0 、 ChatGPT 统统认可是最优方案之一。
3/3/2025 12:00:00 AM
piperliu

消息称软银 CEO 孙正义计划借款 240 亿美元大举投资 AI

据 The Information 报道,软银集团(SoftBank Group)首席执行官孙正义(Masayoshi Son)计划借款 160 亿美元(IT之家备注:当前约 1166.38 亿元人民币)用于投资人工智能领域。消息人士透露,该公司高管上周已向银行方面传达了这一计划。报道指出,这家日本科技投资巨头可能在 2026 年初进一步借款 80 亿美元(当前约 583.19 亿元人民币),以持续推进其在人工智能领域的战略布局。
3/2/2025 6:27:19 PM
远洋

GPT-4.5 性能提升有限、成本却激增 30 倍,OpenAI 面临性价比质疑

科技媒体The Decoder报道,OpenAI新模型GPT-4.5在性能仅小幅提升的情况下,其使用成本却大幅增加。输入tokens的成本是GPT-4o的30倍,输出则为15倍,引发了业界对其实用性的讨论。##GPT4.5 #OpenAI
3/2/2025 2:50:14 PM
故渊

OpenAI计划将Sora视频生成工具集成到ChatGPT中

OpenAI领导团队周五在Discord办公时间会议上宣布,公司计划最终将其AI视频生成工具Sora直接集成到流行的ChatGPT应用程序中,进一步扩展其AI创作生态系统。 目前,Sora仅通过OpenAI于12月推出的专用网络应用提供服务,用户可以使用该应用访问AI视频模型生成长达20秒的电影剪辑。 OpenAI的Sora产品负责人Rohan Sahai表示,公司正在积极研究如何将Sora引入ChatGPT,将两款产品结合起来,但拒绝透露具体时间表。
3/2/2025 10:36:00 AM
AI在线

腾讯元宝电脑版正式发布,支持Windows和macOS系统

腾讯AI助手"腾讯元宝"近日正式推出电脑版应用,同时支持Windows和macOS两大主流操作系统,进一步拓展其在桌面端的服务能力。 此次发布的电脑版专为工作和学习场景打造,旨在帮助用户减轻工作负担、提升效率。 电脑版保留了移动端和网页版的核心功能,用户可以体验到相同的智能对话能力,既可通过DeepSeek-R1满血版和推理模型混元T1进行深度思考,也能借助DeepSeek-V3和腾讯混元Turbo S快速获取答案,满足不同场景需求。
3/2/2025 10:34:00 AM
AI在线

DeepSeek揭秘:AI推理系统背后的545%惊人利润率

DeepSeek在知乎开设官方账号,发布了《DeepSeek-V3/R1推理系统概览》技术文章,首次详细披露其模型推理系统的优化细节和成本利润率信息,标志着备受关注的"DeepSeek开源周"正式结束。 文章介绍了DeepSeek-V3/R1推理系统的两大优化目标:"更大的吞吐,更低的延迟"。 为实现这些目标,DeepSeek采用了大规模跨节点专家并行(EP)技术,尽管这增加了系统复杂性。
3/2/2025 10:26:00 AM
AI在线