文章列表
刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中
上周五,DeepSeek 发推说本周将是开源周(OpenSourceWeek),并将连续开源五个软件库。 第一个项目,果然与推理加速有关。 北京时间周一上午 9 点,刚一上班(同时是硅谷即将下班的时候),DeepSeek 兑现了自己的诺言,开源了一款用于 Hopper GPU 的高效型 MLA 解码核:FlashMLA。
2/24/2025 10:28:00 AM
机器之心
DeepSeek 开源周首日:发布大模型加速利器FlashMLA 解码性能飙升至3000GB/s
DeepSeek 开源周首日正式开源其最新技术成果FlashMLA,这是一款专为英伟达Hopper架构GPU打造的高效多层注意力(Multi-Layer Attention)解码内核。 该技术特别针对变长序列场景进行优化,可显著提升大模型推理性能。 FlashMLA的核心技术特性包括对BF16精度的全面支持,以及采用块大小为64的页式键值缓存(Paged KV Cache)系统,实现更精确的内存管理。
2/24/2025 10:18:00 AM
AI在线
ChatGPT 写 C# 代码翻车现场:这五个坑只有老司机才懂
在AI技术飞速发展的当下,像ChatGPT这样的AI编程工具给开发者带来了便利,输入需求就能快速生成代码。 但它并非完美无缺,在生成C#代码时,会出现不少问题,一些隐患只有经验丰富的老程序员才能洞察。 接下来,就让我们一起看看那些容易翻车的场景。
2/24/2025 10:10:20 AM
conan
DeepSeek 入门指导手册——从入门到精通
DeepSeek 是由杭州深度求索人工智能基础技术研究有限公司精心打造的一款大型语言模型(LLM)。 该模型集自然语言处理(NLP)、计算机视觉(CV)、强化学习(RL)以及多模态融合技术等核心功能于一体。 DeepSeek 在国际上获得了高度关注:下载量:DeepSeek 应用在美国苹果应用商店的免费下载排行榜中超越了 ChatGPT,攀升至榜首位置。
2/24/2025 10:07:10 AM
派大星
DeepSeek 开源周首日:开源 FlashMLA,AI 推理速度再进化!
DeepSeek 开源周day1 推出 FlashMLA! 专为Hopper 架构 GPU打造的 超高效 MLA (Multi-Layer Attention) 解码内核,现在已经正式开源啦! 👏什么是 FlashMLA?
2/24/2025 10:07:04 AM
AI寒武纪
DeepSeek 代码库开源进度 1/5:为 Hopper GPU 优化的高效 MLA 解码内核 FlashMLA
DeepSeek今日启动“开源周”,首个开源的代码库为FlashMLA——针对 Hopper GPU 优化的高效 MLA 解码内核,支持可变长度序列。
2/24/2025 9:47:40 AM
清源
黄仁勋怒怼市场 “你们都搞错了!”:DeepSeek R1 不是来砸场子, 反而是 Nvidia 的 “神助攻”
“你们都搞错了!” 近日, 英伟达掌门人 罕见 “ 动怒 ” , 公开回应了市场对中国 AI 创企 DeepSeek 发布 R1模型的 “ 过度 ” 反应。 在黄仁勋看来, DeepSeek R1的 横空出世非但不是 对 Nvidia 的 “ 饭碗 ” 构成 威胁, 反而是加速AI发展的重大利好, 对英伟达而言 更是 “ 神助攻 ” 一般的存在。 事情起因于今年1月 DeepSeek 发布 R1模型 后, 市场普遍认为 R1的高效性意味着未来AI发展将不再需要如此庞大的算力资源, 这直接导致Nvidia股价单日暴跌16.9%, 市值瞬间蒸发数百亿美元。
2/24/2025 9:47:00 AM
AI在线
超1/3美国大学生用ChatGPT,用户数激增破4亿!AI重塑教育职场
OpenAI发布了最新报告,揭示了一个引人注目的趋势:美国超过三分之一的大学生正在使用ChatGPT。 他们借助这一工具撰写论文、开展项目研究、探索主题,甚至进行创意头脑风暴。 与此同时,AI技能已成为企业青睐人才的重要标准。
2/24/2025 9:35:00 AM
新智元
RAGFlow+DeepSeek-R1:14b落地案例分享(足够详细):机加工行业设备维保场景
看到一个段子说,春节开工以后,中国有 5000 万家企业老板担心会错过 DeepSeek。 虽然感觉有点瞎玩梗,但 DeepSeek 无疑已是当下所谓大模型企业应用落地的"房间里的大象"。 不过想想,其实子弹也才刚刚飞了一个月而已。
2/24/2025 9:33:10 AM
韦东东
DeepSeek-R1 登顶 Hugging Face:以10000 赞力压 150 万个模型
今日凌晨,全球最大开源平台之一 Hugging Face 的首席执行官 Clement Delangue 在社交平台发文宣布,DeepSeek-R1在 Hugging Face 上获得了超过10000个赞,成为该平台近150万个模型中最受欢迎的大模型。 这一里程碑式的成就标志着 DeepSeek-R1在全球 AI 社区中的广泛认可与影响力。 DeepSeek-R1的崛起速度令人瞩目。
2/24/2025 9:30:00 AM
AI在线
OpenAI 最新研究揭示:最先进的 AI 仍难以解决编码问题
近日,OpenAI 的研究人员在一篇新发布的论文中坦言,尽管目前的 AI 技术已经相当先进,但这些模型依然无法与人类程序员相媲美。 OpenAI 首席执行官山姆・阿尔特曼曾表示,预计到今年底,AI 将能够战胜 “低级” 软件工程师,但研究结果却显示,这些 AI 模型仍然面临重大挑战。 图源备注:图片由AI生成,图片授权服务商Midjourney在研究中,OpenAI 团队使用了一种名为 SWE-Lancer 的新基准测试,评估了从自由职业网站 Upwork 上提取的1400多项软件工程任务的表现。
2/24/2025 9:09:00 AM
AI在线
超 20 家央企接入 DeepSeek,涉及能源、通信、汽车等领域
据经济参考报报道,近来,国资央企“牵手”DeepSeek 已成为一股新风潮。据不完全统计,目前有超 20 家央企接入 DeepSeek,涉及能源、通信、汽车、金融、建筑等多个领域。
2/24/2025 8:56:11 AM
远洋
DeepSeek热度正盛,被神话还是确有实力?
2025年年初,中国初创公司DeepSeek以一种近乎现象级的速度崛起,引发了全球科技界的热议。 其模型在苹果应用商店的下载量超越ChatGPT、训练成本仅为竞争对手的零头、技术能力被冠以“颠覆性”标签……这些标签让DeepSeek迅速成为舆论焦点。 然而,在铺天盖地的赞誉与争议中,一个核心问题亟待回答:DeepSeek的“神话”究竟是资本市场的造势,还是AI实力的真实体现?
2/24/2025 8:28:30 AM
Yu
内测即爆火!一键超清修复老视频的AI神器Starlight
经常有群友问我有没有什么把视频修复的工具。 而我过去最推荐的,也是我心中目前最牛逼的视频修复工具,自然就是 TopazVideoAI 了。 这玩意儿我 2023 年就写过教程。
2/24/2025 8:28:15 AM
卡兹克
如何用 11 款 AI 工具让工作效率提升 300 倍
爱因斯坦有句名言:「如果还在重复做同样的事情,却期待会有不同结果,那么就等于疯狂。 」如果想在接下来的日子里提高效率,不妨往下看看。 Promptmetheus —— 不再花时间“修饰”Promptimage.png如果你玩过 ChatGPT,就知道写出好的 Prompt 有时像玄学。
2/24/2025 8:24:39 AM
dev
忘掉 DeepSeek:Qwen 2.5 VL 与 Qwen Max 来了
Qwen 系列又推出了两款令人瞩目的新模型:Qwen 2.5 VL 和 Qwen 2.5 Max。 如果还停留在“DeepSeek 是最强”那一档,就可能要重新考虑一下,因为这两款模型的实力相当惊艳。 什么是 Qwen 2.5 VL?
2/24/2025 8:10:00 AM
de
DeepSeek-R1 成 Hugging Face 最受欢迎大模型,力压近 150 万个“对手”
Clement Delangue今日凌晨发文宣布:DeepSeek-R1在Hugging Face上获得了超过10000个赞,成为该平台近150万个模型之中最受欢迎的大模型,“太令人震惊了!”
2/24/2025 7:59:13 AM
清源
彻底解放双手!如何用DeepSeek结合Stable Diffusion快速出图?
我们热衷探索 Stable Diffusion 是因为它的开源生态与极大的自由度和控制力。 尽管 Stable Diffusion 在图像控制精度上远超 Midjourney,但其复杂操作流程总让创作者望而却步。 然而,最近情况出现了转机。
2/24/2025 6:34:36 AM
Infinite AI