DeepSeek
DeepSeek 悄然发布 DeepSeek-V3–0324:远超预期的重大升级
DeepSeek 近期悄然发布的 DeepSeek-V3–0324,在 AI 社区和行业内引发了广泛关注。 这一版本是 DeepSeek V3 (DeepSeek-V3 深度剖析:下一代 AI 模型的全面解读)模型的重要升级,其带来的一系列技术革新和性能提升远超众人预期,为开发者和企业带来了新的机遇与可能。 一、DeepSeek-V3–0324 的技术突破(一)Multi-head Latent Attention(MLA)和增强的 DeepSeekMoE 架构DeepSeek-V3–0324 引入了 Multi-head Latent Attention(MLA)和增强版的 DeepSeekMoE 架构,这些创新技术为模型性能的提升奠定了坚实基础。
3/28/2025 4:30:00 AM
大模型之路
DeepSeek-V3-0324 发布:更智能的编码体验,加速码农编码效率!
DeepSeek V3 迎来了全新版本的更新;消息一经发布,众多专业人士纷纷对其进行测评,结果令人惊叹不已。 尽管官方将此次升级定义为小版本更新,但在实际的编码能力测试中,其表现丝毫不逊色于大版本的 DeepSeek V4。 在此,我为大家提供一个专业的测评网址:。
3/28/2025 2:00:00 AM
GRPO在《时空谜题》中击败o1、o3-mini和R1
近日,海外大模型产品平台 OpenPipe 上发布了一项研究,阐述其如何通过 GRPO 在重度推理游戏《时空谜题》中超越R1、o1、o3-mini 等模型。 研究作者分别为来自 Ender Research 的强化学习研究员 Brad Hilton 和 OpenPipe 的创始人 Kyle Corbitt。 他们的研究表示,他们不仅将模型与 Sonnet 3.7 的差距缩小至个位百分比,同时实现超过100倍的推理成本优化。
3/27/2025 4:19:00 PM
洪雨欣
DeepSeek上线次月月活用户达1.8亿,AI大模型应用增长迅猛
在当今数智化时代,人工智能(AI)技术的飞速发展正深刻改变着我们的生活和工作方式。 尤其是AI大模型的应用,正成为互联网行业增长的新引擎。 根据QuestMobile发布的最新数据,AI大模型的应用呈现出迅猛的增长态势,其中DeepSeek APP的表现尤为引人注目,其上线次月的活跃用户规模就突破了1.8亿大关。
3/27/2025 12:27:13 PM
AI Infra的起飞前夜,跟两位创业者聊了两小时,从DeepSeek的中国朋友圈,到AI基建演进的价值铁律:流量重赏下的勇夫
作者 | 云昭嘉宾 | 黄新平、谭中意出品 | 51CTO技术栈(微信号:blog51cto)“人生不无聊,有太多变化,太多好玩的事情发生。 ”的确,近期围绕DeepSeek的新发布实在太多了,乱花渐欲迷人眼。 从春节期间企业抢先宣布接入DeepSeekR1、继而接入满血版R1,到DeepSeek一体机的出圈,再到国民应用微信的接入,潮潮迭起。
3/27/2025 12:15:44 PM
云昭
星辰与代码:DeepSeek的发展历程
技术突破阶段2024 年,DeepSeek 强势开启生态扩张与技术爆发的新纪元,成为全球 AI 领域瞩目的焦点。 年初 1 月,DeepSeek 便以 DeepSeek-MoE 震撼登场,创新性架构设计以仅 60% 的计算量损耗,成功超越 Llama 2-7B 性能,为后续技术突破奠定坚实基础,在模型效率优化上迈出关键一步。 紧接着 2 月,DeepSeekMath 在 MATH 基准测试中表现惊艳,成绩飙升至 51.7%,无限逼近 GPT-4 水平,数学推理能力实现质的飞跃,极大提升了模型在复杂数学问题求解上的可靠性与精准度。
3/27/2025 3:50:00 AM
小牛呼噜噜
腾讯自研深度思考模型“混元 T1”正式版上线元宝
腾讯元宝今日凌晨宣布完成了两大模型升级,同时接入腾讯自研的深度思考模型“混元 T1”正式版和 DeepSeek V3-0324 两个模型。
3/26/2025 9:19:42 AM
归泷
DeepSeek 为什么这么牛?幻方三大核心技术解密!
梁文峰说,我们缺的从来都不是钱,而是高端芯片。 幻方官网显示,2022年,公司员工“一只平凡的小猪”一个人就向捐助了1.38亿。 你说,这是钱的事吗?
3/26/2025 9:00:00 AM
架构师之路
通付盾AI Agent信任系统建设宣言:从AI到IA,得Agent者得天下
深耕行业十四年,知浪潮将至,当相向而行。 本文旨在结合企业思考,探讨AI新时代下的技术与应用趋势,对内秉初心以率众,对外纳灼见而求臻。 技术分水岭:算力、算法和数据的能效博弈随着大模型的快速更迭,人类已经走上了通往人工超级智能(ASI)的快车道。
3/26/2025 8:51:00 AM
AI在线
手把手教你实现 Ollama+FastGPT+DeepSeek 打造个人专属 AI 知识库!
本文从零实现,基于Ollama、FastGPT、Deepseek在本地环境中打造属于自己的专业知识库,与大家分享~一、本地部署OllamaOllama是一个开源的本地大语言模型运行框架,专为在本地机器上便捷部署和运行大语言模型(LLM)而设计,无需依赖云端服务。 它提供简单易用的界面和优化的推理引擎,帮助我们轻松加载、管理和运行各种AI模型。 1.
3/26/2025 8:50:00 AM
小喵学AI
DeepSeek 官方详解 V3 模型小版本升级:各项能力全面进阶
3月24日DeepSeek-V3模型小版本更新,今晚官方公布详情。新版在推理、前端开发、中文写作等能力提升,还优化搜索能力。模型开源,参数约660B。#DeepSeek-V3 #模型升级 #AI模型更新
3/25/2025 9:51:49 PM
远洋
李开复:DeepSeek 让中美 AI 核心技术差距缩小至只剩三个月
据路透社报道,AI 大模型公司零一万物 CEO 李开复表示,中国在某些 AI 核心技术方面与美国的差距已缩小至仅三个月,因为 DeepSeek 这样的公司已经找到了如何更高效地使用芯片和应用算法的方法。
3/25/2025 4:44:40 PM
远洋
DeepSeek-V3在Mac Studio上以每秒20个token的速度运行,这对OpenAI来说是一场噩梦
DeepSeek悄然发布了一款新的大型语言模型,已在AI行业掀起波澜——不仅因为其能力出众,更因其部署方式独特。 这款名为DeepSeek-V3-0324的641GB模型出现在AI仓库Hugging Face上,几乎没有进行任何宣传,延续了该公司一贯低调却影响深远的产品发布风格。 此次发布尤为引人注目的是该模型的MIT许可证——允许其免费用于商业用途——以及早期报告显示,它可以直接在消费级硬件上运行,特别是配置了M3 Ultra芯片的Apple Mac Studio。
3/25/2025 11:42:41 AM
Michael Nuñez
互联网医疗加速AI布局,提升服务质量迎接新机遇
随着人工智能技术的迅速发展,互联网医疗平台纷纷加快接入大模型 AI 的步伐,以提升服务效率和用户体验。 以谢方敏为首的方舟健客(06086.HK)表示,经过多年观察,医疗咨询中有高达80% 的问题是重复提问,这不仅浪费了患者的时间,也让医生的工作负担加重。 在这样的背景下,利用 AI 技术来减轻医生负担的呼声愈加强烈。
3/25/2025 10:47:00 AM
AI在线
DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet
昨夜,DeepSeek V3 毫无征兆地来了一波更新,升级到了「DeepSeek-V3-0324」版本。 目前,新版本在 Hugging Face 上可以下载并部署。 Hugging Face 地址:,DeepSeek-V3-0324 没有公布详细的模型卡。
3/25/2025 9:48:22 AM
机器之心
一文看懂多模态思维链DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了
DeepSeek V3升级了,新版本V3-0324。 官方轻描淡写只说是“小版本升级”,但很多人实测下来可一点也不小。 把流行的小球弹跳测试,提升难度到4维空间超立方体也没问题。
3/25/2025 9:28:21 AM
量子位
DeepSeek-V3 模型完成小版本升级,已可试用体验
DeepSeek 在其官方交流群宣布称,DeepSeek-V3 模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API 接口和使用方式保持不变。
3/24/2025 9:10:06 PM
远洋
让 AI 听懂你的语言:DeepSeek 提示词技巧介绍
在生成式AI技术飞速发展的今天,提示词(prompt)已成为人机交互的核心接口。 DeepSeek作为领先的智能对话系统,其输出质量直接取决于提示词的编写水平。 数据显示,专业优化的提示词可将回答准确率提升60%以上。
3/24/2025 10:37:15 AM
Python数智工坊
资讯热榜
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
首月 1 美元,ChatGPT Team 会员美区 / 英区 / 欧洲区 / 澳洲区迎优惠
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
ChatGPT 语音功能升级,实时翻译对话更自然流畅
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试
谷歌 Gemini 应用月下载量超越 ChatGPT,用户活跃度仍显不足
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
数据
谷歌
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
开发者
蛋白质
腾讯
神经网络
研究
3D
生成
训练
苹果
计算
智能体
Sora
机器学习
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
大语言模型
xAI
预测
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
Copilot
算力
工具
LLM
驾驶
API
大型语言模型
应用
RAG
亚马逊