AIGC宇宙 AIGC宇宙

理论

GPT-4价格已被砍成1/150 !OpenAI副总裁回应DeepSeek的竞争,揭秘内部员工花式使用自家产品,有很多工程难题

编辑 | 言征2天前,就在马斯克宣布要以 974 亿美元收购 OpenAI 后,OpenAI 工程副总裁斯里尼瓦斯·纳拉亚南( Srinivas Narayanan) 接受了华尔街日报的一次线下对话,这次对话同样也是出于一场中美 AI 博弈的新语境下:DeepSeek R1低成本训练出可以对标 Open AI o1的强推理模型,甚至登顶了应用排行榜,美国现在已经封禁了DeepSeek应用的下载。 主持人当然没有放过斯里尼瓦斯,问了他这个非常敏感的问题。 那么 OpenAI 内部究竟是如何看待 DeepSeek 的?
2/17/2025 8:00:00 AM
言征

DeepSeek 系列模型详解之 DeepSeek Math

DeepSeek Math发布于2024年2月,虽然是一个7B参数量的模型,但在Math基准榜单上的表现却超过了多个30B~70B参数量的开源模型。 一、技术亮点1. 数据集使用Common Crawl提取的120B(1200亿个)高质量数学网页数据(具体包括与数学相关的token,以及自然语言和代码数据等),总数据量是开源数据集OpenWebMath的9倍。
2/17/2025 8:00:00 AM
小喵

DeepSeek官方发布R1模型推荐设置,这才是正确用法

自春节以来,DeepSeek 就一直是 AI 领域最热门的关键词,甚至可能没有之一,其官方 App 成为了史上最快突破 3000 万日活的应用。 最近一段时间,各家 AI 或云服务厂商更是掀起了部署 DeepSeek-R1 服务的狂潮,甚至让薅羊毛的用户们都有点忙不过来了。 就在刚刚,DeepSeek 官网 X 帐号终于更新了(上一次更新还是在 1 月 28 日),官方下场推荐了部署 DeepSeek-R1 的设置。
2/17/2025 7:35:00 AM
机器之心

当消费陷阱披上 DeepSeek 外衣:你看透"二次支付"背后的双倍收割了吗?

在 AI 浪潮中,真正的竞争力不在于收藏多少课程,而在于保持独立判断和持续学习的能力。 DeepSeek 付费群异军突起,我们还在重复李一舟式的狂欢吗? 去年,也差不多是这个时刻,售卖 AI 课的“中国 AI 教父”李一舟陷入学历和虚假宣传争议,最后,他的课程被下架,今天这股热潮还在继续,仿佛是消费主义对技术革命的异化。
2/17/2025 5:00:00 AM
宇宙之一粟

“RAG界的DeepSeek”开源-企业复杂私域知识理解与推理框架PIKE-RAG

PIKE-RAG框架的设计目标是提供一个灵活且可扩展的RAG系统,应对工业应用中复杂多样的任务需求。 框架的核心是通过有效的知识提取、理解和组织,以及构建连贯的推理逻辑,解决了RAG系统在工业应用中的局限性。 下面来看下PIKE-RAG框架及其实现过程,供参考。
2/17/2025 3:00:00 AM
余俊晖

Spring 宣布接入 DeepSeek

DeepSeek 是深度求索公司发布的大模型,是国产之光。 大家应该学会如何使用 DeepSeek 大模型,下面我们将看下如何开发基于 DeepSeek 大模型的智能应用。 DeepSeek 大模型DeepSeek 推出两款模型;DeepSeek V 系列,对于V系列主要 对话,模型名称:deepseek-chatDeepSeek R 系统,对于R系统主要 推理, 模型名称:deepseek-reasonerDeepSeek 官方更新日志,可以看到模型发布和演化的过程。
2/17/2025 12:25:00 AM
不才陈某

DeepSeek R1遇难题142次"I give up",研究还称需增加推理时机控制机制

最新大语言模型推理测试引众议,DeepSeek R1常常在提供错误答案前就“我放弃”了? ? Cursor刚刚参与了一项研究,他们基于NPR周日谜题挑战(The Sunday Puzzle),构建了一个包含近600个问题新基准测试。
2/17/2025 12:00:10 AM

联想智能云深度集成DeepSeek R1大模型驱动企业“智能进阶”​

记者今天从联想集团了解到,联想智能云(xCloud)解决方案已将DeepSeek R1及其蒸馏系列大模型全面集成到产品矩阵中,覆盖模型服务、模型开发、智能体构建、智能运维等核心环节。 据了解,联想智能云(xCloud)解决方案支持DeepSeek大模型的多种部署方式,包括云端、私有化和一体机/工作站等,可通过完整的AI能力体系和技术整合、场景创新与开源生态的构建,为企业智能化转型注入新动能。 全面支持DeepSeek R1-671B满血模型等全系模型。
2/15/2025 8:15:04 AM

被AI妆到了!DeepSeek教网友化妆,竟像极了「石矶娘娘」

AI好好用报道编辑:杨文DeepSeek的风吹到了美妆区。 DeepSeek 又又又来搞抽象了! 继上次做人类从未见过的菜之后,网友又想到了个新路数:教化妆。
2/14/2025 3:49:00 PM
AI好好用

Grok 3两周内发布,要夺回大模型王座;DeepSeek现象后,AI会改变方向…蔡崇信、李彦宏、马斯克,大佬们在迪拜峰会说了啥

出品 | 51CTO技术栈(微信号:blog51cto)2025年世界政府峰会于2月11日在阿联酋迪拜开幕,不少科技大佬都参与了峰会,并表达了自己的真知灼见。 在这个关口谈论科技创新,AI无可避免地成为了绝对的主角。 马斯克吹捧Grok 3将成为有史以来最聪明的AI,“这(指新模型发布之前)可能是其他模型最后一次超过Grok”。
2/14/2025 3:18:27 PM

模型过剩危机:OpenAI壮士断腕,能否终结开发者'选择恐惧症'?

OpenAI要“动手”了,它计划对自己的模型产品阵容来一场大“瘦身”!就在它准备推出最后一个非推理模型GPT-4.5之际,这家科技巨头罕见地承认,之前的产品发布在客户眼里竟然没啥区别,这让市场有点懵。 OpenAI的首席执行官萨姆·奥特曼最近在X平台上更新了产品路线图,他坦诚地说,公司最近的一些发布确实让市场感到有点困惑。 “我们得把预定路线图分享得更清楚,还得在产品阵容简化上多下点功夫。
2/14/2025 11:25:45 AM
Emilia David

信我,有你想要的!最大化DeepSeek潜能:动态注意力机制

deepseek原理 应用 实践,和大家分享:小众的,deepseek核心技术原理;大众的,提示词要怎么写;今天和大家聊聊,deepseek的核心技术之一的动态注意力机制。 要搞懂这个,先得知道什么是注意力机制? 这是一种通过计算…查询向量(Query)…键向量(Key)…值向量(Value)…,最终得到...的技术。
2/14/2025 11:22:34 AM
58沈剑

报告:DeepSeek爆火激发山寨网站数量激增,超六成解析IP来自美国

尽管美国出台法律禁止下载和使用DeepSeek,甚至对违规者处以最高20年的刑期,但这一措施似乎并未遏制美国人对DeepSeek的兴趣,反而催生了大量山寨网站。 据奇安信XLab实验室的统计,从2024年12月1日至2025年2月3日的两个多月时间里,互联网上出现了2650多个山寨DeepSeek域名。 尤其是自2025年1月26日起,山寨域名开始大规模涌现,并在1月28日达到高峰,当天新增山寨域名超过800个。
2/14/2025 10:40:00 AM

移远通信边缘计算模组成功运行DeepSeek模型,以领先的工程能力加速端侧AI落地

近日,国产大模型DeepSeek凭借其“开源开放、高效推理、端侧友好”的核心优势,迅速风靡全球。 移远通信基于边缘计算模组SG885G,已成功实现DeepSeek模型的稳定运行,并完成了针对性微调。 目前,该模型正在多款智能终端上进行深入测试与优化。
2/14/2025 10:00:00 AM

手机大厂“敲定”AI伙伴:苹果选阿里,三星选智谱,DeepSeek为何被冷落?

在AI手机的浪潮中,市场传出苹果和三星纷纷选择了自己的合作伙伴,其中苹果将牵手阿里,三星拥抱了智谱,而当下备受瞩目的DeepSeek却意外落选。 分析认为,苹果在选择AI合作伙伴时,不仅看重技术实力,更看重合作伙伴的“实战经验”。 DeepSeek虽然在技术上有着亮眼的表现,但其团队规模较小,缺乏服务像苹果这样大型客户的经验。
2/14/2025 9:50:00 AM
舒云

JDK1.8也可以对接DeepSeek-R1,你知道吗?

什么是ai4j首先,我们先了解一下什么是ai4jAI4J 是一款 Java SDK,用于快速接入 AI 大模型应用。 它能整合多平台大模型,如 OpenAI、Ollama、智谱 Zhipu(ChatGLM)、深度求索 DeepSeek、月之暗面 Moonshot(Kimi)、腾讯混元 Hunyuan、零一万物(01)等,为用户提供快速整合 AI 的能力。 其特点包括提供统一的输入输出(对齐 OpenAI)以消除差异化,优化函数调用(Tool Call)和 RAG 调用,支持向量数据库(如 Pinecone),并且支持 JDK1.8,能满足很多仍在使用 JDK8 版本的应用需求。
2/14/2025 9:21:04 AM
了不起

DeepSeek很火,我来泼点冷水

从24年12月DeepSeek出圈以来,DeepSeek风潮越刮越勇,已有席卷全球之势。 各个大厂纷纷宣布自家接入DeepSeek,甚至有机顶盒企业也宣布自家产品接入了,市场情绪一度高涨。 在自媒体上,以DeepSeek为噱头卖课的,教人如何使用DeepSeek提示词的,或者利用DeepSeek 其他AI工具做自媒体赚快钱的,各种案例不胜枚举。
2/14/2025 9:17:16 AM
写文章的老张

仅需3步,稳定快速!火山引擎边缘大模型网关全面支持DeepSeek系列模型

DeepSeek 作为大模型新锐,凭借其在算法、架构及系统等核心领域的创新突破,迅速获得业界瞩目。 在巨大的热度下,面对海量请求,越来越多用户遇到了请求失败、调用超时、结果无法返回等稳定性问题。 火山引擎边缘大模型网关通过一个 API 接入多家模型服务,利用全球边缘节点就近调用,提升响应速度;支持故障自动切换、重试和超时控制,确保服务可靠性;兼容 OpenAI 接口标准,可快速集成 DeepSeek 等模型,降低接入成本。
2/14/2025 9:00:00 AM
边缘云技术团队