AIGC宇宙 AIGC宇宙

理论

Sebastian Raschka:关于DeepSeek R1和推理模型,我有几点看法

著名 AI 研究者和博主 Sebastian Raschka 又更新博客了。 这一次,他将立足于 DeepSeek 技术报告,介绍用于构建推理模型的四种主要方法,也就是如何通过推理能力来增强 LLM。 Sebastian Raschka 表示:「我希望这能提供有价值的见解,并帮助你了解围绕这一主题的快速演变的文献和话题炒作。
2/9/2025 2:42:00 PM
机器之心

外国专家解读DeepSeek:预算有限,如何复制R1推理模型?纯强化学习不现实!不是任何问题都得问DeepSeek!

出品 | 51CTO技术栈(微信号:blog51cto)Sebastian Raschka是一位外国知名的AI专家。 特别在大型语言模型(LLM)研究方面,有着丰富的研究经验。 近日DeepSeek-R1推理模型的推出,将“任何一款不是o1的模型快速蒸馏成具备强推理能力的o1”成为了可能,而且所需的成本和算力都大大降低。
2/8/2025 5:47:08 PM

OpenAI公开了大模型o3-mini的推理思维链

2月8日消息,据外媒报道,OpenAI更新了o3-mini AI模型的“思维链”功能,让用户可以看到模型的思考过程。 这是在DeepSeek-R1发布之后发生的,DeepSeek-R1是一个竞争对手的推理模型,也显示了其反应背后的思维过程。 推理模型旨在逐步分解其决策过程,因此需要更长的时间来生成响应。
2/8/2025 5:00:11 PM
Yu

DeepSeek下棋靠忽悠赢了ChatGPT,网友:孙子兵法都用上了

家人们,要笑不活了。 DeepSeek跟ChatGPT下了一把国际象棋,然后……通过忽悠的方式,竟让ChatGPT直接认输! DeepSeek在这场对决中有多离谱呢?
2/8/2025 1:40:00 PM
量子位

o3-mini数学推理暴打DeepSeek-R1?AIME 2025初赛曝数据集污染大瓜

大语言模型,到底是学会了解决数学问题,还是只是背下了答案? LLM的「Generalize VS  Memorize」之争,迎来最新进展。 苏黎世联邦理工的研究员Mislav Balunović,在X上公布了一众顶级AI推理模型在AIME 2025 I比赛中的结果。
2/8/2025 11:44:03 AM
新智元

山姆·奥特曼揭秘:Deepseek R1性价比之选!

在当今的人工智能领域,大模型之间的竞争日益激烈。 Deepseek 推出的 R1 模型引起了广泛关注。 山姆·奥特曼评价道:“Deepseek 的 R1 是一个令人印象深刻的模型,尤其是在他们能够以这个价格提供的东西方面。
2/8/2025 11:31:17 AM
AGI

同样薪资,该去大厂还是投身 DeepSeek?答案惊人!

这几天,deepseek的招聘刷屏了,贼高的薪资,让太多的人着实羡慕。 图片一、大厂与DeepSeek的核心差异1. 职业发展路径大厂的优势:大厂通常拥有明确的职级体系和晋升机制(如阿里的P序列、腾讯的T序列),员工可以清晰看到从初级到专家的成长路径。
2/8/2025 10:33:33 AM
不才陈某

图解系列|DeepSeek-R1的出众推理能力因何而来?

图片DeepSeek-R1 代表了人工智能发展的又一重要里程碑。 对于机器学习领域的研究人员与开发者群体而言,这次发布之所以备受关注,主要有以下两点:首先,这是一款开源权重的模型,并且提供了更小的、经过蒸馏的版本;其次,它公布并深入探讨了训练方法,该方法能够复现类似于 OpenAI O1 的推理模型。 本文将带您了解这一模型的构建过程。
2/8/2025 9:44:11 AM
追求卓越的

历史分水岭:DeepSeek GitHub星数超越OpenAI!大佬揭秘仅用450美元训推理模型

就在刚刚,历史性的一刻出现了。 DeepSeek项目在GitHub平台上的Star数,已经超越了OpenAI。 热度最高的DeepSeek-V3,Star数如今已达7.7万。
2/8/2025 9:15:00 AM
新智元

你的提示词根本只是在浪费算力,如何让Deepseek发挥极限潜能 - 多跳推理

最近几周自学deepseek原理 应用 实践,一些成果,和大家分享。 对于deepseek的流弊:小部分人会关心,deepseek为什么这么流弊;大部分人会关心,提示词要怎么写;今天和大家聊聊,deepseek的核心机制之一的多跳推理,以及如何优化我们的提示词,使得deepseek能够最大化发挥其多跳推理的潜力。 什么是多跳推理?
2/8/2025 8:30:00 AM
58沈剑

如何运用DeepSeek R1构建一款全栈简历筛选应用

译者 | 核子可乐审校 | 重楼在本文中,我们将共同了解如何使用DeepSeek R1大模型构建智能简历分析应用,节约运营成本。 DeepSeek开源大模型的发布已经在技术社区引发巨大轰动。 如今,开发者们无需接入Claude、ChatGPT等在线AI模型,即可轻松实现本地应用程序构建。
2/8/2025 8:18:39 AM
核子可乐

DeepSeek + IDEA!辅助编程太强了!

2025年的春节可以说是人工智能在中国史上飘红的一段历史时刻,年后上班的第一天,便马不停蹄的尝试新技能。 今天的科技在飞速发展,编程领域的人工智能工具犹如雨后春笋般涌现。 其中,DeepSeek 则以其卓越的性能和智能化的功能,迅速在众多开发者中赢得了青睐。
2/8/2025 8:00:00 AM
码猿技术专栏

Nature:OpenAI推出AI研究助手,深度综述能力引发学界关注

编辑 | matrix科技巨头 OpenAI 于 2 月 2 日推出付费工具「Deep Research」,这款工具能将数十或数百个网站的信息综合为带有引用的完整报告。 此举紧随谷歌在去年 12 月发布的类似产品,标志着 AI 个人研究助手时代的来临。 这类工具最显著的特点是将原本需要数小时的研究工作压缩至数十分钟内完成,引发学界广泛关注。
2/7/2025 6:24:00 PM
ScienceAI

AI成本革命:DeepSeek-R1与OpenAI的颠覆性突破重构企业智能新范式

AI领域的发展日新月异,如果你跟不上步伐,就会落后。 近期的两项进展正在重塑开发者和企业的格局:DeepSeek发布R1模型,以及OpenAI推出新的DeepResearch产品,它们共同重新定义了强大推理模型的成本和可及性,这一点已被广泛报道,然而,较少被讨论的是,它们将如何推动公司采用蒸馏、有监督微调(SFT)、强化学习(RL)和检索增强生成(RAG)等技术,来构建更智能、更专业的AI应用。 在DeepSeek惊人成就的初步兴奋感逐渐平息后,开发者和企业决策者需要考虑这对他们意味着什么。
2/7/2025 3:52:20 PM
Matt Marshall

DeepSeek被禁!最高判刑20年,外交部回应!

过去几周,中国人工智能公司DeepSeek的崛起,在全球范围内引发了一场前所未有的争议。 这款凭借“低成本、高性能”迅速抢占市场的AI工具,不仅一度超越ChatGPT登顶美国应用下载榜,还导致多国科技股震荡下跌。 然而,其“高光时刻”很快被多国的禁令与限制措施打破——美国、意大利、澳大利亚、印度、韩国、日本等国相继以“国家安全”“数据隐私风险”为由,禁止或限制DeepSeek在政府及企业中的使用。
2/7/2025 3:46:17 PM
不才陈某

你的提示词根本只是在浪费算力,让deepseek达到最佳效果的三大原则

最近几周自学deepseek原理 应用 实践,一些成果,和大家分享。 与deepseek这类AI对话,为了达到最佳效果,提示词应当遵循哪三大原则? 清晰性;结构化;细节化;为什么?
2/7/2025 3:11:41 PM
58沈剑

架构创新×模型创新!清微智能全面适配DeepSeek模型推理和训练

随着大模型技术向多场景渗透,算力需求呈现「大规模、高弹性、低成本」三重挑战。 清微智能基于全球领先的可重构计算架构(CGRA)推出可重构算力芯片RPU(Reconfigurable Processing Unit),实现单机高效运行千亿级参数模型推理和训练,以动态硬件重构、全栈优化及高能效比,重新定义国产AI芯片的性价比标杆。 新年伊始,DeepSeek的惊艳亮相,不仅在科技圈掀起巨浪,其影响还涉及到经济、社会、政策等多个维度,相关企业迅速跟进。
2/7/2025 2:04:44 PM
新智元

DeepSeek 用的 GRPO 占用大量内存?有人给出了些破解方法

自 DeepSeek-R1 发布以来,群组相对策略优化(GRPO)因其有效性和易于训练而成为大型语言模型强化学习的热门话题。 R1 论文展示了如何使用 GRPO 从遵循 LLM(DeepSeek-v3)的基本指令转变为推理模型(DeepSeek-R1)。 GRPO 是一种在线学习算法(online learning algorithm),它通过使用训练过程中由训练模型自身生成的数据来进行迭代改进。
2/7/2025 1:45:58 PM
机器之心