AIGC宇宙 AIGC宇宙

理论

DeepSeek-V3在Mac Studio上以每秒20个token的速度运行,这对OpenAI来说是一场噩梦

DeepSeek悄然发布了一款新的大型语言模型,已在AI行业掀起波澜——不仅因为其能力出众,更因其部署方式独特。 这款名为DeepSeek-V3-0324的641GB模型出现在AI仓库Hugging Face上,几乎没有进行任何宣传,延续了该公司一贯低调却影响深远的产品发布风格。 此次发布尤为引人注目的是该模型的MIT许可证——允许其免费用于商业用途——以及早期报告显示,它可以直接在消费级硬件上运行,特别是配置了M3 Ultra芯片的Apple Mac Studio。
3/25/2025 11:42:41 AM
Michael Nuñez

DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet

昨夜,DeepSeek V3 毫无征兆地来了一波更新,升级到了「DeepSeek-V3-0324」版本。 目前,新版本在 Hugging Face 上可以下载并部署。 Hugging Face 地址:,DeepSeek-V3-0324 没有公布详细的模型卡。
3/25/2025 9:48:22 AM
机器之心

大神卡帕西亲自演绎零基础开发APP,ChatGPT四轮对话搞定,一小时即在手机运行

大神卡帕西带着他的教程又来了! 这次不是教学视频,而是手把手教你如何用大模型开发APP——他没有阅读任何文档,也没有在专门平台Swift编程过,在与ChatGPT仅四轮对话的指导下,成功在手机上运行上了。 ,时长00:24这是个用来减肥跟踪APP。
3/25/2025 9:43:03 AM
量子位

一文看懂多模态思维链DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了

DeepSeek V3升级了,新版本V3-0324。 官方轻描淡写只说是“小版本升级”,但很多人实测下来可一点也不小。 把流行的小球弹跳测试,提升难度到4维空间超立方体也没问题。
3/25/2025 9:28:21 AM
量子位

三种RAG部署方案:自购GPU硬件 vs 大模型一体机 vs 云端GPU

春节以后这一个半月,算了下我前后也做了 20 的企业知识库落地咨询,其中无论是线上还是线下,被问到最多的一个问题是:要快速落地本地部署的知识库,应该购买什么硬件? 要回答这个问题,其实需要明确很多前置定语,自购 GPU 硬件、大模型一体机、以及选择云端 GPU 都有各自适用的情形。 这篇试图说清楚三种部署方式的主要特点对比,并在文末给些选择建议参考。
3/24/2025 1:17:11 PM
韦东东

让 AI 听懂你的语言:DeepSeek 提示词技巧介绍

在生成式AI技术飞速发展的今天,提示词(prompt)已成为人机交互的核心接口。 DeepSeek作为领先的智能对话系统,其输出质量直接取决于提示词的编写水平。 数据显示,专业优化的提示词可将回答准确率提升60%以上。
3/24/2025 10:37:15 AM
Python数智工坊

奥特曼豪言:OpenAI第一个发布AGI!下一代人不可能比AI聪明,却没人在意

奥特曼再谈AGI信念! 最近,奥特曼在一期采访中坚定地表示,「OpenAI将第一个发布AGI,并没有人多少人在意」。 他承认,当AI变得更加自主,能够完成通常需要整个组织,才能实现的任务时,自己并不知道那一刻会发生什么。
3/24/2025 9:22:00 AM
新智元

AI浪潮下,对DeepSeek发展的哲学新思考

作者 | 黄宇审校 | 重楼2025年新春伊始,DeepSeek火爆全球,国产大模型横空出世,以“免费 易用 高性能”的组合成功破圈,震动全球科技界。 3月1日,DeepSeek官方披露,按照DeepSeek-R1的token定价水平,公司一日之内总收入为562027美元,成本利润率高达545%。 国产之光DeepSeek的朋友圈持续“扩容”,阿里、百度、腾讯等国内企业,微软、英伟达、亚马逊等国际科技巨头纷纷向DeepSeek抛出橄榄枝,“满血版DeepSeek”一时间成了互联网最新流量密码。
3/21/2025 2:11:19 PM
黄宇

RAG(五)BGE-M3,最流行的开源text embedding模型

项目地址: embedding? Text Embedding 是一种将文本数据映射到高维向量空间的技术,这些向量能够捕捉文本的语义信息。 通过将文本嵌入到向量空间中,我们可以利用向量之间的距离或相似性来衡量文本之间的语义相关性。
3/21/2025 7:00:00 AM
Glodma

HuggingFace、a16z向白宫谏言,激辩OpenAI:开源才是美国最大的AI竞争优势,垄断不是!

编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)近日OpenAI提交有关禁止使用中国模型的提案引起了大家的注意。 不过这也只是提议,包括美国在内的很多企业和大佬对此表示并不赞同——在华盛顿的政策环境中,越来越多地呼吁对人工智能进行最低限度的监管,而Hugging Face则向特朗普政府提出了截然不同的观点:开源和协作的人工智能开发可能是美国最强大的竞争优势。 目前,Hugging Face已经在自家平台上拥有超过 150 万个公共模型,它已向白宫人工智能行动计划提交了建议,认为开源模型的最新突破表明,它们可以以极低的成本达到甚至超越封闭商业系统的能力。
3/20/2025 1:07:11 PM
言征

OpenAI史上最贵模型来了!比DeepSeek贵270倍,100万输出token 600美元

比DeepSeek-R1贵270倍,OpenAI史上最贵模型来了! 就在刚刚,OpenAI上线了推理模型o1-pro的API。 本来大家还挺高兴,结果一看到价格,悬着的心终于死了。
3/20/2025 11:58:29 AM

刚刚,OpenAI史上最贵API上线!o1-pro比DeepSeek-R1溢价千倍

史上最贵API上线了! 刚刚,OpenAI终于正式开放了万众期待的o1-pro API,价格非常感人,比o1-mini贵100多倍。 大模型界的劳斯莱斯根据官方定价,o1-pro输入价格150美金/每百万token,输出价格600美金/每百万token。
3/20/2025 10:20:16 AM
新智元

刚刚,OpenAI推出最贵o1-pro API!千倍于DeepSeek

刚刚,OpenAI 在其开发者 API 中推出了 o1 推理模型的一个更强大版本,即 o1-pro。 据 OpenAI 称,o1-pro 使用比 o1 更多的计算资源来提供更好的响应。 该功能仅对特定开发者开放(Tier 1–5 开发者),支持视觉、函数调用、结构化输出,并与响应和 Batch API 兼容。
3/20/2025 9:46:06 AM
机器之心

DeepSeek 开源 V3/R1 架构设计思路,原来 545% 的利润率,它也只是被逼无奈?

开源周的最后一天,DeepSeek分享了DeepSeek-V3/R1的架构设计思路,让大家能够更系统更全面的了解其推理系统的设计过程,以及更深刻的理解之前开源的6个项目。 DeepSeek-V3/R1推理系统的核心目标是什么? 通过软件架构的优化,达到:更高的吞吐量;更低的延时;为什么DeepSeek要走这一条路?
3/20/2025 9:00:00 AM
架构师之路

比Manus好使!实测谷歌AI显眼包:三秒唠出一个网页,文件直接开口说相声

编辑 | Sia刚晒完「用嘴 P 图、去水印」的神技,一觉醒来谷歌 Gemini 它又上新了! 大伙儿直接对着电脑屏幕发出一阵,啊! 免费体验传送门: Gemini 网页,对话框里突然蹦出个新玩具:Canvas!
3/19/2025 5:46:00 PM
AI好好用

准确率达88%,从随机性走到确定性,AI驱动的小鼠胚胎模型发育预测

编辑丨&干细胞来源的胚胎模型的最新进展改变了发育生物学,提供了对胚胎发生的见解,而不受自然胚胎的限制。 然而,模型开发的多变性对研究标准化来说并不算容易。 德国埃尔斯鲁厄理工学院与美国加州理工学院的科研人员在面对这个问题时,选择使用深度学习来提高选择干细胞衍生胚胎模型的可重复性。
3/19/2025 2:08:00 PM
ScienceAI

AI“入侵”办公室!ChatGPT在全球办公室的普及率飙升至76%

根据时间管理软件DeskTime的最新研究,人工智能(AI)在工作场所的应用正呈现出快速增长的趋势。 截至2024年底,全球有76%的办公室已经引入了ChatGPT这一生成式AI工具,显示出AI技术在现代办公环境中正逐渐成为不可或缺的一部分。 员工使用率与时间投入显著增长2024年,个人对AI工具的使用量有了显著提升。
3/19/2025 10:02:48 AM

老黄发布新核弹B300,英伟达:B200已破DeepSeek-R1推理世界纪录

皮衣老黄,带着最强AI芯片GB300闪亮登场“AI超级碗”GTC,燃爆全场! 性能方面,和去年发布的GB200相比,推理性能是其1.5倍。 据悉,GB300将在今年的下半年出货。
3/19/2025 9:52:50 AM
量子位