DeepSeek
完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
2/2/2025 11:51:00 PM
机器之心
微软、英伟达带头接入Deepseek OpenAI紧急寻求400亿美元新融资
近日,微软、英伟达和亚马逊 AWS 等行业领军企业纷纷接入 Deepseek 的模型托管服务。 这一消息不仅让人对 Deepseek 的前景充满期待,同时也昭示着 AI 行业将迎来新的变革。 与此同时,OpenAI 也在积极筹集新一轮资金,寻求高达400亿美元的融资。
2/2/2025 10:49:00 AM
AI在线
DeepSeek-R1 大模型登陆腾讯云,宣称“一键部署、3 分钟调用”
深圳市腾讯计算机系统有限公司今日发文宣布,DeepSeek-R1 大模型支持一键部署至腾讯云「HAI」上,开发者仅需 3 分钟就能接入调用。
2/2/2025 10:25:54 AM
归泷(实习)
AI 科学家吴恩达长文盛赞 DeepSeek:中国正在生成式 AI 领域追赶美国
“中国的进步非常迅速,许多来自中国的模型,如通义千问、Kimi、书生InternVL和 DeepSeek,已经显著缩小了与美国的差距,尤其在视频生成领域,中国已在某些时刻超越了美国。”
2/1/2025 4:36:16 PM
清源
硅基流动×华为云联合推出基于昇腾云的DeepSeek R1&V3推理服务
2月1日,硅基流动和华为云团队为国内用户推出了基于华为云昇腾云服务的 DeepSeek-R1 和 DeepSeek-V3 大模型推理服务,并在 SiliconCloud 云平台首发上线。这两款模型具有五大特点:支持华为云昇腾云服务,联合创新推理加速,提供稳定的生产级服务,零部署门槛,且有优惠价格。
开发者可以通过 SiliconCloud API 轻松集成这些模型,体验加速效果并提高应用开发效率。平台支持多种大模型和应用,帮助开发者降低算力成本并实现更高效的生成式 AI 应用开发
2/1/2025 4:03:00 PM
新闻助手
360无偿为DeepSeek提供安全服务 纳米AI搜索开通“DeepSeek高速专线”
近日,国产大模型DeepSeek在全球AI领域崭露头角,其展现出的技术实力令人瞩目,但同时也遭遇了外部网络攻击的威胁。 在此背景下,360集团创始人周鸿祎宣布,360将无偿为DeepSeek提供全方位的网络安全防护,以实际行动支持国产AI技术的发展。 作为中国最大的网络安全企业,360集团率先发布倡议书,宣布为DeepSeek提供无偿的网络安全防护。
2/1/2025 3:50:00 PM
AI在线
DeepSeek 突围奥秘曝光:一招 MLA 让全世界抄作业,150 + 天才集结,开出千万年薪
外媒 SemiAnalysis 的一篇深度长文,全面分析了 DeepSeek 背后的秘密 —— 不是「副业」项目、实际投入的训练成本远超 600 万美金、150 多位高校人才千万年薪,攻克 MLA 直接让推理成本暴降......
2/1/2025 3:06:04 PM
清源
硅基流动 x 华为云推出基于昇腾云的 DeepSeek R1&V3 推理服务
硅基流动今日宣布,经过公司和华为云团队连日攻坚,为国内用户献上春节礼物:大模型云服务平台 SiliconCloud 首发上线基于华为云昇腾云服务的 DeepSeek-V3、DeepSeek-R1,得到了 DeepSeek 与华为云的大力支持。
2/1/2025 1:44:57 PM
浩渺
OpenAI 紧急发布 o3-mini,CEO 阿尔特曼罕见认错并称 DeepSeek“非常好”
阿尔特曼罕见地承认了自己的错误,并表示 OpenAI 正在讨论一个新的开源策略。“我个人认为,在这个问题上我们站错了队,需要想出一个不同的开源策略;不是 OpenAI 的每个人都持有这种观点,而且这也不是我们目前的最高优先级。”阿尔特曼表示。(新浪科技)
2/1/2025 1:22:15 PM
-
英特尔酷睿 Ultra 支持 DeepSeek 运行,可在 AI PC 上实现离线使用
英特尔 AI PC 合作伙伴 Flowy 在最新版的 AI PC 助手(英特尔酷睿 Ultra 独享版)上,率先在端侧支持了 DeepSeek-R1 模型,支持翻译、会议纪要、文档撰写等功能。
2/1/2025 10:12:54 AM
浩渺
英特尔 Gaudi 2D AI 加速器为 DeepSeek Janus Pro 模型进行优化
近日,DeepSeek 发布 Janus Pro 模型,英特尔 Gaudi 2D AI 加速器现已针对该模型进行优化,为 AI 应用的落地和规模化发展提供的支持。
2/1/2025 10:01:18 AM
浩渺
DeepSeek-R1 模型全面上线亚马逊云科技
今日起用户可以在 Amazon Bedrock 和 Amazon SageMaker AI 中部署 DeepSeek-R1 模型。
1/31/2025 10:57:11 PM
清源
进击的DeepSeek,一夜之间登陆Microsoft Azure、Cursor、Amazon Bedrock
春节假期未过半,DeepSeek 掀起的巨浪还在影响着所有和人工智能有关的领域。 今天一觉醒来, DeepSeek R1 模型已经正式加入 Azure AI Foundry 和 GitHub 模型目录,开发人员可以快速地进行实验、迭代,并将这款热门模型集成到他们的工作流程中。 这让大家感慨:没有永恒的竞争对手,也没有永恒的合作伙伴,每家公司都应该快速拥抱变化。
1/31/2025 10:35:00 PM
机器之心
硅谷巨头要学会接受:「DeepSeek 现象」只是开始
2025 年的春节无疑已被 DeepSeek 霸屏。 过去三年每年的春节都有一次重磅的 AI 讨论:2023 年是 ChatGPT、2024 年是 Sora,这两股风潮都是由 OpenAI 掀起,而 2025 年则是 DeepSeek 的 V3 与 R1。 除夕当天 1 月 28 日,DeepSeek 更是趁热发布了文生图模型 Janus-Pro,但后者没有 V3 与 R1 吸引的关注大,原因在于其没有像前者一样动摇了过去基座大模型的「奇迹」来源:算力。
1/31/2025 8:57:00 PM
陈彩娴
郭明錤:DeepSeek 加速生成式 AI 产业迈入新阶段
郭明錤称,就算没有DeepSeek-R1,这两个趋势终将显著浮现,但DeepSeek-R1的出现加速了趋势发生。
1/31/2025 5:21:29 PM
清源
英伟达:DeepSeek-R1 模型现已上线 NIM 微服务平台
英伟达今日宣布,DeepSeek-R1 模型现已在 build.nvidia.com 上作为 NVIDIA NIM 微服务预览版提供。DeepSeek-R1 NIM 微服务可以在单个 NVIDIA HGX H200 系统上每秒提供多达 3,872 tokens。
1/31/2025 8:46:46 AM
浩渺
为什么说DeepSeek的R1-Zero比R1更值得关注?
R1-Zero 等模型正在打破人类数据瓶颈,开启 AI 自我进化新范式? 「比起 R1,DeepSeek 同一时间发布的 R1-Zero 更值得关注。 」这是 ARC Prize 联合创始人 Mike Knoop 在一篇新博客中发表的观点。
1/30/2025 7:58:00 PM
机器之心
清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈
一线 AI 洞察,智者深度思考 深入产业变革,共创 AI 未来2025 年伊始,全球 AI 业界被 DeepSeek 刷屏。 当 OpenAI 宣布 5000 亿美元的「星际之门」计划,Meta 在建规模超 130 万 GPU 的数据中心时,这个来自中国的团队打破了大模型军备竞赛的既定逻辑:用 2048 张 H800 GPU,两个月训练出了一个媲美全球顶尖水平的模型。 这一突破不仅撼动了英伟达万亿市值,更引发了整个行业的反思:在通往 AGI 的征程上,我们是否过于盲信算力规模,而忽视了一条更加务实且充满创新可能的路径?
1/30/2025 7:56:00 PM
机器之心
资讯热榜
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
ChatGPT 语音功能升级,实时翻译对话更自然流畅
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
谷歌 Gemini 应用月下载量超越 ChatGPT,用户活跃度仍显不足
长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试
肝了30小时,Flux Kontext是我用过最稳、最能干活的AI图像模型!
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
数据
谷歌
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
开发者
蛋白质
腾讯
神经网络
研究
3D
生成
训练
苹果
计算
智能体
Sora
机器学习
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
大语言模型
xAI
预测
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
Copilot
算力
工具
LLM
驾驶
API
大型语言模型
应用
RAG
亚马逊