DeepSeek

DeepSeek 悄然发布 DeepSeek-V3–0324：远超预期的重大升级

DeepSeek 近期悄然发布的 DeepSeek-V3–0324，在 AI 社区和行业内引发了广泛关注。这一版本是 DeepSeek V3 （DeepSeek-V3 深度剖析：下一代 AI 模型的全面解读）模型的重要升级，其带来的一系列技术革新和性能提升远超众人预期，为开发者和企业带来了新的机遇与可能。一、DeepSeek-V3–0324 的技术突破（一）Multi-head Latent Attention（MLA）和增强的 DeepSeekMoE 架构DeepSeek-V3–0324 引入了 Multi-head Latent Attention（MLA）和增强版的 DeepSeekMoE 架构，这些创新技术为模型性能的提升奠定了坚实基础。

3/28/2025 4:30:00 AM

大模型之路

DeepSeek-V3-0324 发布：更智能的编码体验，加速码农编码效率！

DeepSeek V3 迎来了全新版本的更新;消息一经发布，众多专业人士纷纷对其进行测评，结果令人惊叹不已。尽管官方将此次升级定义为小版本更新，但在实际的编码能力测试中，其表现丝毫不逊色于大版本的 DeepSeek V4。在此，我为大家提供一个专业的测评网址：。

3/28/2025 2:00:00 AM

GRPO在《时空谜题》中击败o1、o3-mini和R1

近日，海外大模型产品平台 OpenPipe 上发布了一项研究，阐述其如何通过 GRPO 在重度推理游戏《时空谜题》中超越R1、o1、o3-mini 等模型。研究作者分别为来自 Ender Research 的强化学习研究员 Brad Hilton 和 OpenPipe 的创始人 Kyle Corbitt。他们的研究表示，他们不仅将模型与 Sonnet 3.7 的差距缩小至个位百分比，同时实现超过100倍的推理成本优化。

3/27/2025 4:19:00 PM

洪雨欣

DeepSeek上线次月月活用户达1.8亿，AI大模型应用增长迅猛

在当今数智化时代，人工智能（AI）技术的飞速发展正深刻改变着我们的生活和工作方式。尤其是AI大模型的应用，正成为互联网行业增长的新引擎。根据QuestMobile发布的最新数据，AI大模型的应用呈现出迅猛的增长态势，其中DeepSeek APP的表现尤为引人注目，其上线次月的活跃用户规模就突破了1.8亿大关。

3/27/2025 12:27:13 PM

AI Infra的起飞前夜，跟两位创业者聊了两小时，从DeepSeek的中国朋友圈，到AI基建演进的价值铁律：流量重赏下的勇夫

作者 | 云昭嘉宾 | 黄新平、谭中意出品 | 51CTO技术栈（微信号：blog51cto）“人生不无聊，有太多变化，太多好玩的事情发生。 ”的确，近期围绕DeepSeek的新发布实在太多了，乱花渐欲迷人眼。从春节期间企业抢先宣布接入DeepSeekR1、继而接入满血版R1，到DeepSeek一体机的出圈，再到国民应用微信的接入，潮潮迭起。

3/27/2025 12:15:44 PM

云昭

星辰与代码：DeepSeek的发展历程

技术突破阶段2024 年，DeepSeek 强势开启生态扩张与技术爆发的新纪元，成为全球 AI 领域瞩目的焦点。年初 1 月，DeepSeek 便以 DeepSeek-MoE 震撼登场，创新性架构设计以仅 60% 的计算量损耗，成功超越 Llama 2-7B 性能，为后续技术突破奠定坚实基础，在模型效率优化上迈出关键一步。紧接着 2 月，DeepSeekMath 在 MATH 基准测试中表现惊艳，成绩飙升至 51.7%，无限逼近 GPT-4 水平，数学推理能力实现质的飞跃，极大提升了模型在复杂数学问题求解上的可靠性与精准度。

3/27/2025 3:50:00 AM

小牛呼噜噜

腾讯自研深度思考模型“混元 T1”正式版上线元宝

腾讯元宝今日凌晨宣布完成了两大模型升级，同时接入腾讯自研的深度思考模型“混元 T1”正式版和 DeepSeek V3-0324 两个模型。

3/26/2025 9:19:42 AM

归泷

DeepSeek 为什么这么牛？幻方三大核心技术解密！

梁文峰说，我们缺的从来都不是钱，而是高端芯片。幻方官网显示，2022年，公司员工“一只平凡的小猪”一个人就向捐助了1.38亿。你说，这是钱的事吗？

3/26/2025 9:00:00 AM

架构师之路

通付盾AI Agent信任系统建设宣言：从AI到IA，得Agent者得天下

深耕行业十四年，知浪潮将至，当相向而行。本文旨在结合企业思考，探讨AI新时代下的技术与应用趋势，对内秉初心以率众，对外纳灼见而求臻。技术分水岭:算力、算法和数据的能效博弈随着大模型的快速更迭，人类已经走上了通往人工超级智能（ASI）的快车道。

3/26/2025 8:51:00 AM

AI在线

手把手教你实现 Ollama+FastGPT+DeepSeek 打造个人专属 AI 知识库！

本文从零实现，基于Ollama、FastGPT、Deepseek在本地环境中打造属于自己的专业知识库，与大家分享~一、本地部署OllamaOllama是一个开源的本地大语言模型运行框架，专为在本地机器上便捷部署和运行大语言模型（LLM）而设计，无需依赖云端服务。它提供简单易用的界面和优化的推理引擎，帮助我们轻松加载、管理和运行各种AI模型。 1.

3/26/2025 8:50:00 AM

小喵学AI

DeepSeek 官方详解 V3 模型小版本升级：各项能力全面进阶

3月24日DeepSeek-V3模型小版本更新，今晚官方公布详情。新版在推理、前端开发、中文写作等能力提升，还优化搜索能力。模型开源，参数约660B。#DeepSeek-V3 #模型升级 #AI模型更新

3/25/2025 9:51:49 PM

远洋

李开复：DeepSeek 让中美 AI 核心技术差距缩小至只剩三个月

据路透社报道，AI 大模型公司零一万物 CEO 李开复表示，中国在某些 AI 核心技术方面与美国的差距已缩小至仅三个月，因为 DeepSeek 这样的公司已经找到了如何更高效地使用芯片和应用算法的方法。

3/25/2025 4:44:40 PM

远洋

DeepSeek-V3在Mac Studio上以每秒20个token的速度运行，这对OpenAI来说是一场噩梦

DeepSeek悄然发布了一款新的大型语言模型，已在AI行业掀起波澜——不仅因为其能力出众，更因其部署方式独特。这款名为DeepSeek-V3-0324的641GB模型出现在AI仓库Hugging Face上，几乎没有进行任何宣传，延续了该公司一贯低调却影响深远的产品发布风格。此次发布尤为引人注目的是该模型的MIT许可证——允许其免费用于商业用途——以及早期报告显示，它可以直接在消费级硬件上运行，特别是配置了M3 Ultra芯片的Apple Mac Studio。

3/25/2025 11:42:41 AM

Michael Nuñez

互联网医疗加速AI布局，提升服务质量迎接新机遇

随着人工智能技术的迅速发展，互联网医疗平台纷纷加快接入大模型 AI 的步伐，以提升服务效率和用户体验。以谢方敏为首的方舟健客（06086.HK）表示，经过多年观察，医疗咨询中有高达80% 的问题是重复提问，这不仅浪费了患者的时间，也让医生的工作负担加重。在这样的背景下，利用 AI 技术来减轻医生负担的呼声愈加强烈。

3/25/2025 10:47:00 AM

AI在线