AIGC宇宙 AIGC宇宙

理论

“万模裸奔”,DeepSeek正颠覆网络安全行业游戏规则

对于企业而言,AI既是提升生产力的强大工具,同时也为攻击者和恶意内部人员提供了“大杀器”。 随着生成式AI(例如ChatGPT和DeepSeek)在企业和政府机构中的广泛应用和不安全部署,“万模裸奔”产生的数据安全风险已经到了失控的边缘。 2025年是AI安全元年,首席信息安全官(CISO)们必须提前做好准备,应对“万模裸奔”引发的数据安全危机。
2/21/2025 11:23:59 AM
佚名

OpenAI百万美元豪测:顶级大模型取代不了程序员

当Sam Altman宣称大模型将取代"低阶程序员"时,OpenAI自家的最新研究却给出了相反的答案。 该研究联合百名工程师开展SWE-Lancer基准测试,结果显示:面对价值百万美元的真实软件开发任务,三大顶尖大模型的总收入竟不足21%,最强者Claude 3.5也仅解决26%技术问题。 这场AI与人类程序员的"抢饭碗"对决,暂时以机器的惨败告终。
2/21/2025 11:08:46 AM
佚名

两万字长文深度解密DeepSeek-R1、Kimi 1.5,强推理模型凭什么火出圈?

刚刚过去的春节,DeepSeek-R1 推理大模型引爆了国内外 AI 社区,并火出了圈。 最近,各个行业又掀起了接入 DeepSeek 的狂潮,大家唯恐落后于人。 北大 AI 对齐团队对包括 DeepSeek-R1、Kimi-K1.5在内的一些强推理模型进行了 2 万字的技术解读,也是此前 o1 解读(北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式)的续作。
2/21/2025 10:34:49 AM
机器之心

OpenAI周活跃用户突破4亿,高管称DeepSeek竞争并未影响产品路线图

尽管市场竞争愈发激烈,OpenAI的用户数量仍在持续攀升。 据OpenAI首席运营官布拉德·莱特卡普(Brad Lightcap)透露,截至今年2月,OpenAI的周活跃用户数已达到4亿,相较于2024年12月的3亿增长了33%。 这一数据此前并未对外公开。
2/21/2025 10:26:56 AM
佚名

人形机器人可能引发高风险全球对决

DeepSeek的R1出现震撼了市场,从美国股市抹去了超过1万亿美元,并在科技界引发了冲击波。 它让人工智能公司争先恐后地重新评估他们的战略,并对这些进步做出回应。 此次发布还突显出,美国和中国之间的人工智能竞赛比许多人预期的要激烈。
2/21/2025 10:14:59 AM
AI情报室

想要提升 DeepSeek 回复质量,会这一招就够了(90%的人不知道)

今天继续介绍deepseek核心技术:反事实推理。 上一篇简要回顾:反事实推理,是一种通过构建与事实相反的假设性情景,探索因果关系和潜在结果的逻辑推理方法;反事实推理,有着严密的数学模型,属于因果推断第三层次:关联,干预,反事实;反事实推理,能帮deepseek突破数据量上限,加强结果解释性,提升回复丰富度;画外音:详见《deepseek凭啥能给出这么丰富的答案 - 反事实推理(上)》。 反事实推理,对我们写提示词,获取更佳的回答质量有什么启示呢?
2/21/2025 9:30:00 AM
58沈剑

抛弃OpenAI,Figure亮王牌:史上首次两个机器人「共脑」,网友直呼太恐怖!

与OpenAI分手之后,Figure自研首个模型终于交卷了! 不用ChatGPT,Figure直接把视觉-语言-动作模型(VLA)——Helix装入人形机器人大脑。 它可以让机器人感知、语言理解、学习控制,是一个端到端的通用模型。
2/21/2025 9:06:28 AM
新智元

如何使用Java设计一套多智能体系统

译者 | 核子可乐审校 | 重楼2025年将成为AI智能体之年。 在本文的场景中,AI智能体是一套能够利用AI通过一系列步骤实现目标的系统,且具备就结果进行推理及更正的能力。 在实践中,智能体遵循的步骤可总结成图表形式。
2/21/2025 8:17:13 AM
核子可乐

断交OpenAI后,人形机器人独角兽首秀:一个神经网络控制整个上身,能听懂人话可抓万物

与OpenAI断交之后,Figure首个成果出炉:Helix,一个端到端通用控制模型,它能让机器人像人一样感知、理解和行动。 只需自然语言提示,机器人就能拿起任何东西,哪怕是从没见过的东西,比如这个活泼的小仙人掌。 从官方放出的演示中可以看到,它在接收到人类的提示后,就会按照指令逐一拿起桌上的物品放进冰箱。
2/21/2025 6:05:54 AM

DeepSeek R1范式复现笔记

作者 | yulei自DeepSeek R1技术报告🐳开放以来,开源社区涌现了多种「复现」工作。 本R1复现笔记旨在以多个开源项目的再复现以及交叉验证为目标,探索R1/R1-zero中强化学习步骤带来的模型效果提升,并尝试展望R1技术在未来模型训练与业务落地上的前景。 一、R1 开源项目梳理目前主流的 R1 系列复现工作如表 1 所示。
2/20/2025 3:32:28 PM
腾讯技术工程

DeepSeek创始人是谁?这个问题DeepSeek也整不会了!

梁文锋到底有多低调? 你问DeepSeek官网,连自家的产品都整不会“DeepSeek的创始人是谁”这个问题。 事情是这样的。
2/20/2025 2:54:56 PM

DeepSeek相关人士已辟谣:融资消息均为谣言 阿里股价微跌0.88%

出品 | 51CTO技术栈(微信号:blog51cto)针对外媒称“DeepSeek 首次考虑筹集外部资金”的消息,DeepSeek相关人士今天上午已经进行了辟谣——融资消息均为谣言。 (图1)但作为另一主角的阿里,尚无回应。 腾讯科技报道,阿里美股股价微跌0.88%。
2/20/2025 2:30:31 PM

简单示例提升DeepSeek-R1美国数学邀请赛AIME分数:以步骤为粒度对齐上下文学习与推理

仅需简单提示,满血版DeepSeek-R1美国数学邀请赛AIME分数再提高。 上海交大、港中文、上海AI实验室等带来最新成果BoostStep对齐推理和上下文学习粒度,大幅提升上下文学习性能,突破少样本学习上限。 图片大语言模型使用多步推理解决复杂数学问题,即先将复杂问题分解为多个步骤并逐步进行推理。
2/20/2025 12:09:22 PM

OpenAI的GPT-5即将问世:目前我们所知道的一切

想象一下,一个能浏览互联网、理解世界、记忆事物,还能像人一样自然聊天并进行复杂推理的AI。 这听起来像科幻电影里的情节,但实际上,这样的技术已经离我们不远了。 随着ChatGPT的不断进化,其最新版本GPT-5即将横空出世,预示着AI正朝着通用智能的目标大步迈进。
2/20/2025 11:20:41 AM
Bernard Marr

新突破!中国电信复现DeepSeek R1,探索行业大模型建设新路径

DeepSeek是由深度求索开发的低成本、高性能开源大语言模型,该模型通过强化学习与混合专家结构(MOE)的技术创新,以工程优化突破硬件限制,实现了“算力需求下降但性能提升”的反共识路径。 开源策略重塑了AI生态,为全球开发者提供普惠工具,标志着从“算力堆砌”向“算法效率”的产业转型。 中国电信政企信息服务事业群DeepSeek攻坚团队紧跟技术潮流,基于行业数据复现R1模型,提出行业大模型优化的新思路。
2/20/2025 11:12:11 AM

从大模型性能优化到DeepSeek部署

一、背景Deepseek-r1模型的爆火标志着本地部署大模型的需求日益增长。 本文主要探讨如何优化本地部署大模型的性能,并结合我们的实践进行评测分析,文章最后我们将分享如何在本地高效部署满血版Deepseek-r1大模型。 在生产环境中,我们已部署专用的大模型推理集群,并对其性能进行了全面优化。
2/20/2025 9:27:46 AM
menglinggong

DeepSeek公务员上岗!公务员铁饭碗不保?

图片2月18日,“AI公务员上岗”冲上热搜第一名,在深圳福田区率先推出基于DeepSeek开发的AI数字员工,首批70名上岗。 这一事件标志着智能体技术从实验室走向社会治理的第一线,开启人机协作的新纪元。 据介绍,福田这70名新员工可实现:公文格式修正准确率超 95%,审核时间缩短90%错误率控制在 5%以内;“执法文书生成助手”将执法笔录秒级生成执法文书初稿;民生诉求分拨准确率从70%提升至95%;“AI招商助手”企业分析筛选效率提升 30%……“幸福福田”官微显示,广东深圳福田区推出基于DeepSeek开发的AI数智员工,上线福田区政务大模型2.0版,除了有DeepSeek通用能力外,还结合各部门各单位实际业务流程,量身定制个性化智能体,首批满足240个业务场景使用。
2/20/2025 12:00:00 AM
数仓宝贝库

DeepSeek新注意力机制引热议!梁文锋亲自提交预印本,目标明确降低计算成本

DeepSeek新注意力机制论文一出,再次引爆讨论热度。 依然是熟悉的画风,熟悉的味道——那边马斯克疯狂烧了20万张卡训出Grok 3,这厢DeepSeek重点关注的依然是压缩计算和推理成本。 具体来说,新论文提出了一种可原生训练的稀疏注意力机制,名为NSA(Native Sparse Attention)。
2/19/2025 4:01:37 PM
量子位