AIGC宇宙 AIGC宇宙

DeepSeek

DeepSeek玩家能提前拿苹果新品!只要15万元,在家跑满血版R1

号称地表最强的M3 Ultra,本地跑满血版DeepSeek R1,效果到底如何? 其实,有些DeepSeek玩家们已经提前拿到手做过实测了。 例如这位Alex老哥就是其中之一:他提前拿到了两台搭载M3 Ultra的Mac Studio,配置是这样的:M3 Ultra(32 核中央处理器、80 核图形处理器和 32 核神经网络引擎)512G统一内存1TB固态硬盘具体来说,Alex老哥用配备Thunderbolt 5互连技术(传输速率为 80Gbps)的EXO Labs设备,来运行完整的DeepSeek R1模型(671B、8-bit)。
3/13/2025 12:41:37 PM
量子位

DeepSeek 开源 EPLB,世界上从来没有什么腾空出世!

deepseek开源DualPipe的同一天,还开源了EPLB。 今天来简单聊聊EPLB,包懂。 EPLB是干嘛的?
3/13/2025 10:31:20 AM
架构师之路

DeepSeek-R1的方法迁移到多模态大模型-开源Vision-R1实现方法思路

刚开始琢磨使用DeepSeek-R1风格训练多模态R1模型,就看到这个工作,本文一起看看,供参考。 先提出问题,仅靠 RL 是否足以激励 MLLM 的推理能力? 结论:不能,因为如果 RL 能有效激励推理能力,Vision-R1-Zero 应该表现出生成复杂 CoT 的能力,并在基准测试中提升准确率。
3/13/2025 8:13:47 AM
余俊晖

H20芯片困局:在DeepSeek崛起下的挑战与反思

在当今全球科技竞争的宏大棋局之中,美国针对中国半导体和人工智能芯片发起的制裁行动,恰似汹涌暗潮,正以悄无声息却又极具颠覆性的方式,重塑着中国人工智能产业的发展格局。 在这一复杂局势下,H20 芯片作为特殊的存在进入中国市场,看似是为国内企业送来的“及时雨”,实则暗藏玄机,背后隐藏着诸多亟待剖析的问题。 近年来,美国对我国人工智能发展的制裁手段可谓层层加码、环环相扣。
3/12/2025 5:59:31 PM
徐勇

32B IOI奥赛击败DeepSeek-R1!Open R1开源复刻第三弹,下一步R1-Zero

Hugging Face的Open R1再度升级! Hugging Face的Open R1是一个社区驱动的项目,目标是创建一个完全开源的DeepSeek-R1版本。 目前,已有模型如OlympicCoder-32B和数据集如codeforces发布,显示了项目的进展。
3/12/2025 1:55:05 PM
新智元

使用 VLLM 部署 DeepSeek:基于 Ubuntu 22.04 + RTX 4090 + Docker 的完整指南

最近,大语言模型(LLM)的部署已经成为 AI 开发者绕不开的核心技能。 而 VLLM 作为一款高性能、低延迟的推理引擎,在大模型推理领域迅速崛起。 今天,我就带大家从零开始,在 Ubuntu 22.04 RTX 4090 Docker 环境下,部署 DeepSeek模型,并让它跑起来!
3/12/2025 12:37:50 PM
写代码的中年人

DeepSeek 开源的 DualPipe,居然是梁文峰写的,你感性?

继DeepGEMM之后,deepseek开源了第四弹DualPipe。 今天来简单聊聊DualPipe,包懂。 DualPipe是干嘛的?
3/12/2025 10:36:32 AM
架构师之路

让DeepSeek推荐客户!6个章节深度聊聊设计师如何让私单来找你

若干天之前,有位客户添加我的微信咨询包装设计,一番常规沟通之后,她竟然说是通过 DeepSeek 的推荐找到我的。 当时的我大为震惊,大家看图:与客户的沟通截图. 于是我马上通过 DeepSeek 去询问远麦刘斌的知名度如何,又获得了让我吃惊的答案,DeepSeek 接近 80%还原了我近 10 年来在互联网留下的痕迹,并给出了结论性概括。
3/12/2025 7:17:54 AM
设计史太浓

王炸组合DeepSeek+剪映!手把手教你打造小红书爆款视频!

内容视频化正在成为大势所趋,尤其在小红书平台"破圈"后。 相比图文载体,视频具备 3 倍以上的信息触达效率和优秀的用户留存率,但传统视频制作的高时间成本始终是设计师的最大创作瓶颈。 本文将带你解锁零剪辑基础也能快速产出优质视频内容的方法:AI 提效:从脚本到成片的智能创作链路.
3/12/2025 6:45:30 AM
团队58UXD

用DeepSeek辅助,让竞品分析更有效的3个方法

很多时候,我们辛苦做的竞品分析没有达到预期效果,往往是因为报告里只罗列了信息,却缺乏观点和行动建议。 又或者结论和信息不一致,难以支撑观点。 无论是产出正式的多页报告,还是简短到一页的陈述,目的都是告知竞品调研的结论,为接下来的设计能达成一致作出贡献。
3/12/2025 12:42:02 AM
林影落

欧洲银行纷纷尝试 DeepSeek

The Information 报道,据相关人士透露,自今年 1 月以来,包括汇丰银行、英国国民西敏寺银行(英国四大银行之一)以及西班牙对外银行(BBVA)在内的欧洲主要金融机构,一直在将 DeepSeek 与其他 AI 模型一起进行测试。这和美国银行拒绝使用 DeepSeek 的态度截然不同。
3/11/2025 11:11:18 PM
陈俊熹

DeepSeek 官方:“R2 将在 3 月 17 日发布”为假消息

据蓝鲸新闻报道,针对 DeepSeek 将在 3 月 17 日发布下一代 R2 模型的传闻,DeepSeek 官方企业咨询账号在用户群中回应称,“辟谣:R2 发布为假消息”。
3/11/2025 7:54:51 PM
远洋

阿里巴巴AI搜索引擎Accio用户突破百万 新增AI功能赋能全球贸易

阿里巴巴旗下AI搜索引擎Accio用户数量已于3月11日突破100万里程碑。 该搜索引擎近期推出了一系列新的人工智能功能,旨在为全球贸易中的中小企业提供支持。 根据先前报道,阿里国际于2月28日宣布其面向全球B2B买家的首个AI搜索引擎Accio已接入DeepSeek等先进推理模型,并正式上线深度研究、商业探索等功能。
3/11/2025 4:32:00 PM
AI在线

“新神登场”,消息称 DeepSeek-R2 AI 模型将于 3 月 17 日发布

媒体智通财经援引“消息人士”,称 DeepSeek 下一代 AI 模型 DeepSeek-R2 将于 3 月 17 日发布。
3/11/2025 3:01:26 PM
漾仔

基于Dify与DeepSeek:零门槛训练自己的专属AI大模型

在人工智能(AI)技术日益普及的今天,训练属于自己的AI大模型不再是遥不可及的梦想。 随着DeepSeek  R1的发布,其部署成本仅为ChatGPT的十分之一,这一突破让更多企业和个人能够轻松参与AI开发。 未来,垂直领域的AI大模型和应用将如雨后春笋般涌现,这无疑是一个巨大的机遇。
3/11/2025 10:51:35 AM
冰河技术

DeepSeek级AI?训练自己的推理模型仅需七个步骤

译者 | 布加迪审校 | 重楼谁需要超级计算机? 仅用15GB VRAM就可以训练你自己的功能强大的AI推理模型! DeepSeek的R1模型在不需要人类反馈的情况下就能进行更深思熟虑的推理,已颠覆了大语言模型(LLM)领域。
3/11/2025 8:37:42 AM
布加迪

从DeepSeek MoE专家负载均衡谈起

上周中的时候, 同事给我了一份线上DeepSeek-R1推理的Expert激活的数据用来研究一些专家负载均衡的算法, 当然这些线上数据来自于公司内部的请求, 从中观测出前面10层专家基本上是相对均衡的, 而越到后面不均衡程度差异越大. 当时讨论到这个问题时, 是怀疑内部的一些请求是否专注于电商领域而带来的不平衡特性, 于是做了一些研究. 恰好搜到Intel的一篇论文《Semantic Specialization in MoE Appears with Scale: A Study of DeepSeek-R1 Expert Specialization》[1]有一些基于语义的MoE分析专家的专业性相关的问题, 再加上前几天看到某个公众号采访某院长的一个比较有趣的说法:“Dense模型适合toB业务,MoE模型适合toC业务”.
3/11/2025 12:35:00 AM
zartbot

一条神奇的指令,DeepSeek直接文生图

最近又发现一条神奇的提示词指令,借助Markdown的image标签可以直接在DeepSeek当前窗口得到我们想要的图片。 效果预览我们先看看这条指令的效果:图片这是岳哥在DeepSeek官网直接生成的一辆高铁行驶在海面上生成的图片,可以在DeepSeek上直接预览和下载图片。 提示词指令这条提示词指令具体如下:复制提示词解读这条这里分为3部分第一部分的描述性内容是告诉DeepSeek要生成AI图片,并且指出要如何生成第二部分的url则是具体的AI图片生成的指令,通过替换Prompt的内容来生成第三部分则是希望DeepSeek将AI绘画的提示词以中文的形式显示出来虽然是在DeepSeek当前窗口直接输出,但其实上这里还是借助了第三方AI绘画网站生成图片的功能。
3/11/2025 12:22:00 AM
、平凡世界