理论

GPT-4价格已被砍成1/150 !OpenAI副总裁回应DeepSeek的竞争，揭秘内部员工花式使用自家产品，有很多工程难题

编辑 | 言征2天前，就在马斯克宣布要以 974 亿美元收购 OpenAI 后，OpenAI 工程副总裁斯里尼瓦斯·纳拉亚南（ Srinivas Narayanan）接受了华尔街日报的一次线下对话，这次对话同样也是出于一场中美 AI 博弈的新语境下：DeepSeek R1低成本训练出可以对标 Open AI o1的强推理模型，甚至登顶了应用排行榜，美国现在已经封禁了DeepSeek应用的下载。主持人当然没有放过斯里尼瓦斯，问了他这个非常敏感的问题。那么 OpenAI 内部究竟是如何看待 DeepSeek 的？

2/17/2025 8:00:00 AM

言征

DeepSeek 系列模型详解之 DeepSeek Math

DeepSeek Math发布于2024年2月，虽然是一个7B参数量的模型，但在Math基准榜单上的表现却超过了多个30B~70B参数量的开源模型。一、技术亮点1. 数据集使用Common Crawl提取的120B(1200亿个)高质量数学网页数据(具体包括与数学相关的token，以及自然语言和代码数据等)，总数据量是开源数据集OpenWebMath的9倍。

2/17/2025 8:00:00 AM

小喵

DeepSeek官方发布R1模型推荐设置，这才是正确用法

自春节以来，DeepSeek 就一直是 AI 领域最热门的关键词，甚至可能没有之一，其官方 App 成为了史上最快突破 3000 万日活的应用。最近一段时间，各家 AI 或云服务厂商更是掀起了部署 DeepSeek-R1 服务的狂潮，甚至让薅羊毛的用户们都有点忙不过来了。就在刚刚，DeepSeek 官网 X 帐号终于更新了（上一次更新还是在 1 月 28 日），官方下场推荐了部署 DeepSeek-R1 的设置。

2/17/2025 7:35:00 AM

机器之心

当消费陷阱披上 DeepSeek 外衣：你看透"二次支付"背后的双倍收割了吗？

在 AI 浪潮中，真正的竞争力不在于收藏多少课程，而在于保持独立判断和持续学习的能力。 DeepSeek 付费群异军突起，我们还在重复李一舟式的狂欢吗？去年，也差不多是这个时刻，售卖 AI 课的“中国 AI 教父”李一舟陷入学历和虚假宣传争议，最后，他的课程被下架，今天这股热潮还在继续，仿佛是消费主义对技术革命的异化。

2/17/2025 5:00:00 AM

宇宙之一粟

“RAG界的DeepSeek”开源-企业复杂私域知识理解与推理框架PIKE-RAG

PIKE-RAG框架的设计目标是提供一个灵活且可扩展的RAG系统，应对工业应用中复杂多样的任务需求。框架的核心是通过有效的知识提取、理解和组织，以及构建连贯的推理逻辑，解决了RAG系统在工业应用中的局限性。下面来看下PIKE-RAG框架及其实现过程，供参考。

2/17/2025 3:00:00 AM

余俊晖

Spring 宣布接入 DeepSeek

DeepSeek 是深度求索公司发布的大模型，是国产之光。大家应该学会如何使用 DeepSeek 大模型，下面我们将看下如何开发基于 DeepSeek 大模型的智能应用。 DeepSeek 大模型DeepSeek 推出两款模型；DeepSeek V 系列，对于V系列主要对话，模型名称：deepseek-chatDeepSeek R 系统，对于R系统主要推理，模型名称：deepseek-reasonerDeepSeek 官方更新日志，可以看到模型发布和演化的过程。

2/17/2025 12:25:00 AM

不才陈某

DeepSeek R1遇难题142次"I give up"，研究还称需增加推理时机控制机制

最新大语言模型推理测试引众议，DeepSeek R1常常在提供错误答案前就“我放弃”了？？ Cursor刚刚参与了一项研究，他们基于NPR周日谜题挑战（The Sunday Puzzle），构建了一个包含近600个问题新基准测试。

2/17/2025 12:00:10 AM

联想智能云深度集成DeepSeek R1大模型驱动企业“智能进阶”

记者今天从联想集团了解到，联想智能云（xCloud）解决方案已将DeepSeek R1及其蒸馏系列大模型全面集成到产品矩阵中，覆盖模型服务、模型开发、智能体构建、智能运维等核心环节。据了解，联想智能云（xCloud）解决方案支持DeepSeek大模型的多种部署方式，包括云端、私有化和一体机/工作站等，可通过完整的AI能力体系和技术整合、场景创新与开源生态的构建，为企业智能化转型注入新动能。全面支持DeepSeek R1-671B满血模型等全系模型。

2/15/2025 8:15:04 AM

被AI妆到了！DeepSeek教网友化妆，竟像极了「石矶娘娘」

AI好好用报道编辑：杨文DeepSeek的风吹到了美妆区。 DeepSeek 又又又来搞抽象了！继上次做人类从未见过的菜之后，网友又想到了个新路数：教化妆。

2/14/2025 3:49:00 PM

AI好好用

Grok 3两周内发布，要夺回大模型王座；DeepSeek现象后，AI会改变方向…蔡崇信、李彦宏、马斯克，大佬们在迪拜峰会说了啥

出品 | 51CTO技术栈（微信号：blog51cto）2025年世界政府峰会于2月11日在阿联酋迪拜开幕，不少科技大佬都参与了峰会，并表达了自己的真知灼见。在这个关口谈论科技创新，AI无可避免地成为了绝对的主角。马斯克吹捧Grok 3将成为有史以来最聪明的AI，“这（指新模型发布之前）可能是其他模型最后一次超过Grok”。

2/14/2025 3:18:27 PM

模型过剩危机：OpenAI壮士断腕，能否终结开发者'选择恐惧症'？

OpenAI要“动手”了，它计划对自己的模型产品阵容来一场大“瘦身”!就在它准备推出最后一个非推理模型GPT-4.5之际，这家科技巨头罕见地承认，之前的产品发布在客户眼里竟然没啥区别，这让市场有点懵。 OpenAI的首席执行官萨姆·奥特曼最近在X平台上更新了产品路线图，他坦诚地说，公司最近的一些发布确实让市场感到有点困惑。 “我们得把预定路线图分享得更清楚，还得在产品阵容简化上多下点功夫。

2/14/2025 11:25:45 AM

Emilia David

信我，有你想要的！最大化DeepSeek潜能：动态注意力机制

deepseek原理应用实践，和大家分享：小众的，deepseek核心技术原理；大众的，提示词要怎么写；今天和大家聊聊，deepseek的核心技术之一的动态注意力机制。要搞懂这个，先得知道什么是注意力机制？这是一种通过计算…查询向量(Query)…键向量(Key)…值向量(Value)…，最终得到...的技术。

2/14/2025 11:22:34 AM

58沈剑

报告：DeepSeek爆火激发山寨网站数量激增，超六成解析IP来自美国

尽管美国出台法律禁止下载和使用DeepSeek，甚至对违规者处以最高20年的刑期，但这一措施似乎并未遏制美国人对DeepSeek的兴趣，反而催生了大量山寨网站。据奇安信XLab实验室的统计，从2024年12月1日至2025年2月3日的两个多月时间里，互联网上出现了2650多个山寨DeepSeek域名。尤其是自2025年1月26日起，山寨域名开始大规模涌现，并在1月28日达到高峰，当天新增山寨域名超过800个。

2/14/2025 10:40:00 AM

移远通信边缘计算模组成功运行DeepSeek模型，以领先的工程能力加速端侧AI落地

近日，国产大模型DeepSeek凭借其“开源开放、高效推理、端侧友好”的核心优势，迅速风靡全球。移远通信基于边缘计算模组SG885G，已成功实现DeepSeek模型的稳定运行，并完成了针对性微调。目前，该模型正在多款智能终端上进行深入测试与优化。

2/14/2025 10:00:00 AM

手机大厂“敲定”AI伙伴：苹果选阿里，三星选智谱，DeepSeek为何被冷落？

在AI手机的浪潮中，市场传出苹果和三星纷纷选择了自己的合作伙伴，其中苹果将牵手阿里，三星拥抱了智谱，而当下备受瞩目的DeepSeek却意外落选。分析认为，苹果在选择AI合作伙伴时，不仅看重技术实力，更看重合作伙伴的“实战经验”。 DeepSeek虽然在技术上有着亮眼的表现，但其团队规模较小，缺乏服务像苹果这样大型客户的经验。

2/14/2025 9:50:00 AM

舒云

JDK1.8也可以对接DeepSeek-R1，你知道吗？

什么是ai4j首先，我们先了解一下什么是ai4jAI4J 是一款 Java SDK，用于快速接入 AI 大模型应用。它能整合多平台大模型，如 OpenAI、Ollama、智谱 Zhipu（ChatGLM）、深度求索 DeepSeek、月之暗面 Moonshot（Kimi）、腾讯混元 Hunyuan、零一万物（01）等，为用户提供快速整合 AI 的能力。其特点包括提供统一的输入输出（对齐 OpenAI）以消除差异化，优化函数调用（Tool Call）和 RAG 调用，支持向量数据库（如 Pinecone），并且支持 JDK1.8，能满足很多仍在使用 JDK8 版本的应用需求。

2/14/2025 9:21:04 AM

了不起

DeepSeek很火，我来泼点冷水

从24年12月DeepSeek出圈以来，DeepSeek风潮越刮越勇，已有席卷全球之势。各个大厂纷纷宣布自家接入DeepSeek，甚至有机顶盒企业也宣布自家产品接入了，市场情绪一度高涨。在自媒体上，以DeepSeek为噱头卖课的，教人如何使用DeepSeek提示词的，或者利用DeepSeek 其他AI工具做自媒体赚快钱的，各种案例不胜枚举。

2/14/2025 9:17:16 AM

写文章的老张

仅需3步，稳定快速！火山引擎边缘大模型网关全面支持DeepSeek系列模型

DeepSeek 作为大模型新锐，凭借其在算法、架构及系统等核心领域的创新突破，迅速获得业界瞩目。在巨大的热度下，面对海量请求，越来越多用户遇到了请求失败、调用超时、结果无法返回等稳定性问题。火山引擎边缘大模型网关通过一个 API 接入多家模型服务，利用全球边缘节点就近调用，提升响应速度；支持故障自动切换、重试和超时控制，确保服务可靠性；兼容 OpenAI 接口标准，可快速集成 DeepSeek 等模型，降低接入成本。

2/14/2025 9:00:00 AM

边缘云技术团队

资讯热榜

苹果发布全新Xcode 26开发者工具：内置ChatGPT先进AI功能那个男人回来了！Ilya现身多伦多大学毕业典礼：AI 像是用数字方式复制出来的大脑！不管你愿不愿意，AI都将深刻影响你的一生！ DeepSeek前高管秘密创业，新AI Agent项目已获顶级VC押注支持MCP！开源智能体开发框架 Rowboat：打造你的智能助手只需几分钟 ChatGPT 语音功能升级，实时翻译对话更自然流畅长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试谷歌 Gemini 应用月下载量超越 ChatGPT，用户活跃度仍显不足苹果将 ChatGPT 和其他 AI 模型引入 Xcode

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画数据谷歌机器人大模型 Midjourney 用户智能开源微软 GPT 学习 Meta 图像技术 AI创作 Gemini 论文马斯克 Stable Diffusion 算法代码英伟达 Anthropic 芯片生成式开发者蛋白质腾讯神经网络研究 3D 生成训练苹果计算智能体 Sora 机器学习 AI设计 AI for Science Claude GPU AI视频人形机器人华为搜索场景百度大语言模型 xAI 预测伟达深度学习 Transformer 字节跳动 Agent 模态具身智能神器推荐 LLaMA 文本视觉 Copilot 算力工具 LLM 驾驶 API 大型语言模型应用 RAG 亚马逊

理论