AIGC宇宙 AIGC宇宙

AI

DeepSeek 用的 GRPO 占用大量内存?有人给出了些破解方法

自 DeepSeek-R1 发布以来,群组相对策略优化(GRPO)因其有效性和易于训练而成为大型语言模型强化学习的热门话题。 R1 论文展示了如何使用 GRPO 从遵循 LLM(DeepSeek-v3)的基本指令转变为推理模型(DeepSeek-R1)。 GRPO 是一种在线学习算法(online learning algorithm),它通过使用训练过程中由训练模型自身生成的数据来进行迭代改进。
2/7/2025 1:45:58 PM
机器之心

DeepSeek 爆红引发业界“狂欢”,第三方厂商嗅到商机跟风售卖 AI 网课 / 外设获利颇丰

国产 AI 公司深度求索开发的 AI 大模型 DeepSeek 在网络上成为爆款,作为一款开源、免费的大模型,尽管深度求索公司本身还未实现盈利,但目前已有大量其他厂商嗅到商机,打着“DeepSeek”旗号开始跟风“挣钱”。
2/7/2025 1:27:23 PM
漾仔

DeepSeek R1 集成难题完美解决:Deepseek4j 已开源

一、为什么需要 deepseek4j? 1.1 现有框架的局限性思维链内容丢失:R1 最核心的推理过程完全被忽略响应模式不兼容:无法处理"思考在前、结论在后"的输出模式参数限制:temperature、top_p 等关键参数设置失效流式处理不完善:用户体验欠佳虽然笔者上篇博客介绍了如何使用 WebFlux 直接调用 DeepSeek API,但这种方式存在一些问题:开发成本高:直接调用 API 或改造现有框架需要处理大量细节,包括请求构建、响应解析、错误处理等。 一不做二不休,为了彻底解决这些问题,笔者基于 OpenAI4J[1] 项目的优秀架构,打造了一个专门面向 DeepSeek 的开箱即用方案 DeepSeek4J[2]增强支持 DeepSeek 独有的思维链和账单特性增加 Project Reactor 的全面响应式支持提供集成 Spring Boot Starter,提供自动配置 二、核心特性 ✨ 完整保留思维链能力、账单🚀 响应式流式处理🛠 简单优雅的 API 设计📦 开箱即用的 Spring Boot 集成,同时支持 2.x / 3.x💡 内置调试页面🔍 详细的请求响应日志🔧 灵活的代理配置⚡️ 响应式编程支持 三、快速开始 3.1 添加依赖复制3.2 配置参数复制3.3 基础使用复制3.4 进阶配置复制
2/7/2025 1:10:06 PM
冷冷

​OpenAI 宣布将在欧洲存储客户数据,响应当地数据保护需求

近日,人工智能开发公司 OpenAI 宣布,将允许一些欧洲客户在欧洲联盟内存储和处理与其聊天机器人互动的数据,而不是将数据存储在美国或其他地区。 这一举措凸显了欧盟监管对大型数字平台及人工智能开发者在数据使用方面的深远影响。 图源备注:图片由AI生成,图片授权服务商Midjourney根据 OpenAI 的声明,支付费用让员工或学生使用聊天机器人的公司和教育机构,将可以选择将数据存储在欧洲。
2/7/2025 11:10:00 AM
AI在线

OpenAI联创Schulman闪电跳槽!从Anthropic转投Murati新公司

跑去隔壁Anthropic的OpenAI联创John Schulman,又又又跳槽了。 《财富》爆料,Schulman新的去向,是加入原OpenAI首席技术官Mira Murati的新创业公司。 此时距离他转投Anthropic,仅仅不到半年。
2/7/2025 10:13:16 AM
量子位

OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek

刚刚,OpenAI把o3-mini的推理思维链公开了。 从今日起,免费用户和付费用户都可以看到模型的思维过程,OpenAI终于Open一回。 图片评论区网友纷纷:让我们谢谢DeepSeek。
2/7/2025 9:05:36 AM

DeepSeek正在杀死程序员?不,它杀死的是一整个时代

——从“人肉编码”到“AI工程化”,中国软件行业的范式革命已至导语:当技术革命的枪声响起2023年GitHub统计显示,中国开发者平均每天写300行代码,其中270行是重复性业务逻辑。 而在DeepSeek等AI编码工具冲击下,这种“人肉堆代码”的模式正在崩塌——某跨国IT服务商已裁撤40%初级Java岗位,同时开出百万年薪急招AI工程师。 这不是简单的工具替代,而是一场关乎行业生死存亡的认知革命。
2/7/2025 8:30:37 AM
斯巴达人

OpenAI 升级 o3-mini 模型思维链,提高 AI 推理透明度

OpenAI 公司今天(2 月 7 日)在 X 平台发布推文,宣布面向免费和付费用户更新 o3-mini 的思维链,并为付费用户更新 o3-mini-high 的思维链,更透明、更详细地展示模型的“推理”步骤以及得出答案的方式。
2/7/2025 7:20:02 AM
故渊

网易有道全面拥抱DeepSeek-R1,推理大模型加速个性化教学升级

1月20日,DeepSeek震撼发布DeepSeek-R1,这款推理大模型在数学、编程及逻辑推理等多个领域展现出了与OpenAI顶尖模型比肩的实力,同时实现了API调用成本90%-95%的大幅缩减,无疑为科技界投下了一颗开年“重磅炸弹”。 DeepSeek-R1的深度推理能力不仅为AI产业的多元化发展开辟了新航道,也为包括教育在内的多个行业带来了革新动力。 作为教育科技企业,网易有道坚持深入挖掘教育场景下的大模型应用价值。
2/6/2025 7:37:00 PM
新闻助手

力压DeepSeek-R1!谷歌Gemini 2.0系列集体上新,全员跻身大模型竞技场前10

终于,谷歌DeepMind坐不住了,出手就是超越DeepSeek-R1! 劈柴哥亲自官宣Gemini 2.0家族更新,分别是Gemini 2.0 Flash、Gemini 2.0 Pro、Gemini 2.0 Flash-Lite。 同时,稳居大模型竞技场第1名的推理模型Gemini 2.0 Flash Thinking,已在Gemini App中推出。
2/6/2025 12:10:00 PM
量子位

在 TKE 上部署 AI 大模型(以DeepSeek-R1为例)

概述本文介绍如何在 TKE 上部署 AI 大模型,以 DeepSeek-R1 为例。 部署思路使用 Ollama 运行 AI 大模型,再通过 OpenWebUI 暴露一个聊天交互的界面,OpenWebUI 会调用 ollama 提供的 API 来与大模型交互。 Ollama 与 OpenWebUI 介绍Ollama 是一个运行大模型的工具,可以看成是大模型领域的 Docker,可以下载所需的大模型并暴露 API。
2/6/2025 10:18:45 AM
I am roc roc

英伟达憾失DeepSeek关键人才?美国放走AI「钱学森」,哈佛教授痛心疾首

DeepSeek给美国造成的威胁,还在加剧。 就在昨天,DeepSeek的日活数已经达到ChatGPT的23%,每日应用下载量接近500万! a16z联创Marc Andreessen发文谁能想到,做出DeepSeek关键贡献的人才,本来是可能留在美国的。
2/6/2025 9:30:00 AM
新智元

OpenAI 的最新 Deep Research,知多少?

Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景最新突破 - 构建高效、灵活的创新的 AI Agent - Deep Research 。 众所周知,以 Google 及 OpenAI 持续引领着人工智能代理的发展,并将其推向新的高度。 AI Agents 作为下一代人工智能工具,具备在数字环境中自主行动的能力,其潜在价值远超我们目前所熟知的问答式聊天机器人。
2/6/2025 8:12:41 AM
架构驿站

谷歌 Gemini 2.0 Flash 系列 AI 模型登场,编程和推理性能迈上新台阶

谷歌公司昨日(2 月 5 日)发布博文,邀请所有 Gemini 应用用户,访问最新 Gemini 2.0 Flash 应用模型,并放开 2.0 Flash Thinking 推理实验模型。
2/6/2025 6:57:26 AM
故渊

DeepSeek 大模型引爆市场:概念股开盘集体涨停

2月5日,A股市场开盘后,DeepSeek 概念股集体爆发,每日互动、美格智能、天娱数科、航锦科技、南威软件等多只股票竞价涨停。 此外,飞利信、万兴科技、昆仑万维、海光信息等个股也涨幅靠前。 这一市场热潮的背后,是中国 AI 初创公司深度求索(DeepSeek)发布的两款大模型——DeepSeek-V3和 DeepSeek-R1。
2/5/2025 10:50:00 AM
AI在线

谷歌悄然删除了不开发用于武器或监控AI的承诺

近日,谷歌在其官方网站上删除了此前承诺不开发用于武器或监控的人工智能(AI)的相关内容,此举引发了广泛的讨论和关注。 根据彭博社的报道,这一变化出现在谷歌更新其公共 AI 原则页面时,之前在页面中明确提到的 “我们不会追求的应用” 部分已经被完全删除,令人意外。 图源备注:图片由AI生成,图片授权服务商Midjourney在被询问对此变动的看法时,谷歌向《科技 Crunch》指出了一篇新的关于 “负责任 AI” 的博客文章。
2/5/2025 10:23:00 AM
AI在线

DeepSeek告诉我:程序员在AI时代不必焦虑

一、AI焦虑的本质:程序员为何担心被取代? 凌晨2点,程序员小王对着屏幕发呆。 GitHub Copilot刚帮他自动补全了代码,但看着一行行自动生成的函数,他突然感到后背发凉:“如果AI连代码都能写,我的价值在哪里?
2/3/2025 10:07:43 PM
方才coding

郭明錤称 DeepSeek 爆红加速 AI 模型“设备端化”趋势

分析师郭明錤今天发文,认为随着 DeepSeek 的爆红,设备端 AI 的趋势将加速。
2/3/2025 4:01:37 PM
漾仔