AIGC宇宙 AIGC宇宙

理论

AI成本革命:DeepSeek-R1与OpenAI的颠覆性突破重构企业智能新范式

AI领域的发展日新月异,如果你跟不上步伐,就会落后。 近期的两项进展正在重塑开发者和企业的格局:DeepSeek发布R1模型,以及OpenAI推出新的DeepResearch产品,它们共同重新定义了强大推理模型的成本和可及性,这一点已被广泛报道,然而,较少被讨论的是,它们将如何推动公司采用蒸馏、有监督微调(SFT)、强化学习(RL)和检索增强生成(RAG)等技术,来构建更智能、更专业的AI应用。 在DeepSeek惊人成就的初步兴奋感逐渐平息后,开发者和企业决策者需要考虑这对他们意味着什么。
2/7/2025 3:52:20 PM
Matt Marshall

DeepSeek被禁!最高判刑20年,外交部回应!

过去几周,中国人工智能公司DeepSeek的崛起,在全球范围内引发了一场前所未有的争议。 这款凭借“低成本、高性能”迅速抢占市场的AI工具,不仅一度超越ChatGPT登顶美国应用下载榜,还导致多国科技股震荡下跌。 然而,其“高光时刻”很快被多国的禁令与限制措施打破——美国、意大利、澳大利亚、印度、韩国、日本等国相继以“国家安全”“数据隐私风险”为由,禁止或限制DeepSeek在政府及企业中的使用。
2/7/2025 3:46:17 PM
不才陈某

你的提示词根本只是在浪费算力,让deepseek达到最佳效果的三大原则

最近几周自学deepseek原理 应用 实践,一些成果,和大家分享。 与deepseek这类AI对话,为了达到最佳效果,提示词应当遵循哪三大原则? 清晰性;结构化;细节化;为什么?
2/7/2025 3:11:41 PM
58沈剑

架构创新×模型创新!清微智能全面适配DeepSeek模型推理和训练

随着大模型技术向多场景渗透,算力需求呈现「大规模、高弹性、低成本」三重挑战。 清微智能基于全球领先的可重构计算架构(CGRA)推出可重构算力芯片RPU(Reconfigurable Processing Unit),实现单机高效运行千亿级参数模型推理和训练,以动态硬件重构、全栈优化及高能效比,重新定义国产AI芯片的性价比标杆。 新年伊始,DeepSeek的惊艳亮相,不仅在科技圈掀起巨浪,其影响还涉及到经济、社会、政策等多个维度,相关企业迅速跟进。
2/7/2025 2:04:44 PM
新智元

DeepSeek 用的 GRPO 占用大量内存?有人给出了些破解方法

自 DeepSeek-R1 发布以来,群组相对策略优化(GRPO)因其有效性和易于训练而成为大型语言模型强化学习的热门话题。 R1 论文展示了如何使用 GRPO 从遵循 LLM(DeepSeek-v3)的基本指令转变为推理模型(DeepSeek-R1)。 GRPO 是一种在线学习算法(online learning algorithm),它通过使用训练过程中由训练模型自身生成的数据来进行迭代改进。
2/7/2025 1:45:58 PM
机器之心

DeepSeek R1 集成难题完美解决:Deepseek4j 已开源

一、为什么需要 deepseek4j? 1.1 现有框架的局限性思维链内容丢失:R1 最核心的推理过程完全被忽略响应模式不兼容:无法处理"思考在前、结论在后"的输出模式参数限制:temperature、top_p 等关键参数设置失效流式处理不完善:用户体验欠佳虽然笔者上篇博客介绍了如何使用 WebFlux 直接调用 DeepSeek API,但这种方式存在一些问题:开发成本高:直接调用 API 或改造现有框架需要处理大量细节,包括请求构建、响应解析、错误处理等。 一不做二不休,为了彻底解决这些问题,笔者基于 OpenAI4J[1] 项目的优秀架构,打造了一个专门面向 DeepSeek 的开箱即用方案 DeepSeek4J[2]增强支持 DeepSeek 独有的思维链和账单特性增加 Project Reactor 的全面响应式支持提供集成 Spring Boot Starter,提供自动配置 二、核心特性 ✨ 完整保留思维链能力、账单🚀 响应式流式处理🛠 简单优雅的 API 设计📦 开箱即用的 Spring Boot 集成,同时支持 2.x / 3.x💡 内置调试页面🔍 详细的请求响应日志🔧 灵活的代理配置⚡️ 响应式编程支持 三、快速开始 3.1 添加依赖复制3.2 配置参数复制3.3 基础使用复制3.4 进阶配置复制
2/7/2025 1:10:06 PM
冷冷

突发!o3-mini思维链公开,却被曝光全是「作假」,奥特曼现身解释网友炸锅

OpenAI,真的被DeepSeek逼急了! 活久见,就在刚刚,OpenAI把o3-mini的「思维链」公开了。 比如问「怎么今天不是星期五啊😅」?
2/7/2025 11:20:50 AM
新智元

OpenAI联创Schulman闪电跳槽!从Anthropic转投Murati新公司

跑去隔壁Anthropic的OpenAI联创John Schulman,又又又跳槽了。 《财富》爆料,Schulman新的去向,是加入原OpenAI首席技术官Mira Murati的新创业公司。 此时距离他转投Anthropic,仅仅不到半年。
2/7/2025 10:13:16 AM
量子位

OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek

刚刚,OpenAI把o3-mini的推理思维链公开了。 从今日起,免费用户和付费用户都可以看到模型的思维过程,OpenAI终于Open一回。 图片评论区网友纷纷:让我们谢谢DeepSeek。
2/7/2025 9:05:36 AM

DeepSeek正在杀死程序员?不,它杀死的是一整个时代

——从“人肉编码”到“AI工程化”,中国软件行业的范式革命已至导语:当技术革命的枪声响起2023年GitHub统计显示,中国开发者平均每天写300行代码,其中270行是重复性业务逻辑。 而在DeepSeek等AI编码工具冲击下,这种“人肉堆代码”的模式正在崩塌——某跨国IT服务商已裁撤40%初级Java岗位,同时开出百万年薪急招AI工程师。 这不是简单的工具替代,而是一场关乎行业生死存亡的认知革命。
2/7/2025 8:30:37 AM
斯巴达人

百度智能云上架DeepSeek R1/V3,上线首日超1.5万家客户调用​

2月3日百度智能云宣布 DeepSeek-R1和 DeepSeek-V3模型上架百度智能云千帆平台,并宣布提供行业领先的超低推理价格。 模型上线首日,已有超1.5万家客户通过千帆平台进行模型调用。 为降低模型使用成本,百度智能云在推理引擎性能优化技术、推理服务工程架构创新以及推理服务全链路安全保障上的进行深度融合。
2/6/2025 5:00:40 PM

DeepSeek日活用户数突破2000万,增长势头远超ChatGPT

国内AI产品榜的最新统计数据显示,DeepSeek应用在上线仅20天后,其日活跃用户数(DAU)迅速突破2000万大关,具体数字高达2215万。 这一成绩不仅彰显了DeepSeek强大的用户吸引力,也进一步证明了AI技术在当今社会的广泛应用和巨大潜力。 用户增长迅猛,全球影响力显著提升日活用户数:截至2025年2月4日,DeepSeek的日活跃用户数已突破2000万,达到2215万。
2/6/2025 4:20:41 PM
极客AI

OpenAI推出新人工智能代理Deep Research

上个月,DeepSeek改写了人工智能的剧本,这促使整个行业坐下来关注。 一些科技巨头被迫重新思考他们的游戏,因为旧的战术可能会在这个快速变化的环境中削弱自己。 OpenAI是人工智能领域的关键参与者,对DeepSeek的挑战做出了回应,承诺“提供更好的模型”并加快产品发布。
2/6/2025 3:07:27 PM
AI情报室

​对标DeepSeek,Gemini 2.0轻量模型开卷“极致性价比”!谷歌守住多模态阵地,油管、地图应用们都要开始做推理了!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)DeepSeek的火热,让Google坐不住了! 深夜,Google推出了Gemini 2.0全家桶,一口气推出了三个模型型号:Gemini 2.0 Flash、Gemini 2.0 Flash-LiteGemini 2.0 Pro。 图片看技术报告,2.0系列的三个模型在通用、代码、推理、事实性、多语言等方面指标如下。
2/6/2025 1:13:07 PM
伊风

力压DeepSeek-R1!谷歌Gemini 2.0系列集体上新,全员跻身大模型竞技场前10

终于,谷歌DeepMind坐不住了,出手就是超越DeepSeek-R1! 劈柴哥亲自官宣Gemini 2.0家族更新,分别是Gemini 2.0 Flash、Gemini 2.0 Pro、Gemini 2.0 Flash-Lite。 同时,稳居大模型竞技场第1名的推理模型Gemini 2.0 Flash Thinking,已在Gemini App中推出。
2/6/2025 12:10:00 PM
量子位

在 TKE 上部署 AI 大模型(以DeepSeek-R1为例)

概述本文介绍如何在 TKE 上部署 AI 大模型,以 DeepSeek-R1 为例。 部署思路使用 Ollama 运行 AI 大模型,再通过 OpenWebUI 暴露一个聊天交互的界面,OpenWebUI 会调用 ollama 提供的 API 来与大模型交互。 Ollama 与 OpenWebUI 介绍Ollama 是一个运行大模型的工具,可以看成是大模型领域的 Docker,可以下载所需的大模型并暴露 API。
2/6/2025 10:18:45 AM
I am roc roc

谷歌反击,最强Gemini 2.0全家桶砸场DeepSeek!物理模拟编码惊人Jeff Dean站台

满血版Gemini 2.0终于来了。 刚刚,谷歌一口气连发三款模型:Gemini 2.0 Pro、Gemini 2.0 Flash、Gemini 2.0 Flash-Lite,2.0家族集结完毕。 最强Pro版本支持2M上下文,配备了谷歌搜索、代码执行能力,编码推理性能完全碾压1.5 Pro。
2/6/2025 9:52:12 AM

英伟达憾失DeepSeek关键人才?美国放走AI「钱学森」,哈佛教授痛心疾首

DeepSeek给美国造成的威胁,还在加剧。 就在昨天,DeepSeek的日活数已经达到ChatGPT的23%,每日应用下载量接近500万! a16z联创Marc Andreessen发文谁能想到,做出DeepSeek关键贡献的人才,本来是可能留在美国的。
2/6/2025 9:30:00 AM
新智元