理论
DeepSeek R1 满血版来了,完全不卡!
前言最近DeepSeek爆火。 我之前也发过多篇关于DeepSeek的文章,推荐大家使用它。 今年是AI的一个风口。
2/25/2025 8:20:50 AM
苏三
五分钟,构建国产数据库智能体
近期,圈里很多朋友,都尝试利用 DeepSeek 构建自己的智能体。 我也利用腾讯元器,将个人公众号内容做了个智能体,可以实现简单的问答。 那么延展来看,智能体除了可利用公众号内容,也可使用离线文件等方式来构建。
2/25/2025 7:49:36 AM
DeepSeek一夜把百度干回20年前,网友:还有这好事?
没完了,刚刚接入DeepSeek的百度,又双叒叕搞事情了。 最新消息,“百度一下 你就知道”这条2005年开始伴随着中国用户度过了互联网黄金岁月的Slogan,回归了。 有意思的是,这种“炒冷饭”的行为在大厂中已经出现了人传人的现象。
2/24/2025 2:20:00 PM
量子位
多行业拥抱DeepSeek,全不顾它身上的“刺”
在数字化浪潮席卷全球的今天,技术革命的脚步正以指数级速率重构人类社会发展轨迹。 而DeepSeek的出现,毫无疑问重塑了商业世界的运行法则——从产业上游的芯片制造到终端消费者的移动支付,从医疗影像的毫厘级诊断到教育资源的跨时空共享,算法与数据的交织已然突破想象力的边界。 当下,众多产业正在与人工智能产生"化学反应",这种由技术创新引发的链式反应,正在三百六十度解构既有行业秩序,催生出"生产力跃迁2.0"时代的全新商业生态。
2/24/2025 2:15:16 PM
科技云报到
DeepSeek开源周“第一刀”砍向算力!重磅开源FlashMLA,挑战H800算力极限,网友直呼:极致的工程设计!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)上周五,DeepSeek刚刚预告了重磅开源周! 周一一早,DeepSeek就履行承诺,开源了针对 Hopper GPU 的高效 MLA 解码内核——FlashMLA! 图片根据DeepSeek介绍,FlashMLA内核针对变长序列进行了优化,是已投入生产的核心技术。
2/24/2025 12:52:46 PM
伊风
从理论到实践:学会如何商用 DeepSeek,收藏这一篇就够了
Hi,大家好,我叫秋水,当前专注于 AI Agent 和 AI 工作流自动化。 近期 DeepSeek,全球闻名,大家纷纷在讨论,我看过很多文章和视频,很多说的有点夸张,23 年 AI 刚来的那些内容,又重新说了一遍,只是把 AI 两个字母换成了 DeepSeek。 在我看来,DeepSeek 出圈的主要原因是能力强、价格低、开源、可以本地部署,这个好处在于企业在 AI 方面的应用会加速落地,我们国内的用户不需要那么麻烦的出海使用 ChatGPT 了。
2/24/2025 12:20:14 PM
秋水
DeepSeek开源放大招:FlashMLA让H800算力狂飙!曝光低成本秘笈
就在刚刚,DeepSeek放出了开源周首日的重磅炸弹——FlashMLA。 这是DeepSeek专为英伟达Hopper GPU打造的高效MLA解码内核,特别针对变长序列进行了优化,目前已正式投产使用。 经实测,FlashMLA在H800 SXM5平台上(CUDA 12.6),在内存受限配置下可达最高3000GB/s,在计算受限配置下可达峰值580 TFLOPS。
2/24/2025 11:32:57 AM
dream
“源神”DeepSeek!突破H800性能上限,FlashMLA重磅开源,算力成本还能降
DeepSeek开源周第一天,降本大法公开——FlashMLA,直接突破H800计算上限。 网友:这怎么可能? ?
2/24/2025 11:31:33 AM
ChatGPT 写 C# 代码翻车现场:这五个坑只有老司机才懂
在AI技术飞速发展的当下,像ChatGPT这样的AI编程工具给开发者带来了便利,输入需求就能快速生成代码。 但它并非完美无缺,在生成C#代码时,会出现不少问题,一些隐患只有经验丰富的老程序员才能洞察。 接下来,就让我们一起看看那些容易翻车的场景。
2/24/2025 10:10:20 AM
conan
DeepSeek 入门指导手册——从入门到精通
DeepSeek 是由杭州深度求索人工智能基础技术研究有限公司精心打造的一款大型语言模型(LLM)。 该模型集自然语言处理(NLP)、计算机视觉(CV)、强化学习(RL)以及多模态融合技术等核心功能于一体。 DeepSeek 在国际上获得了高度关注:下载量:DeepSeek 应用在美国苹果应用商店的免费下载排行榜中超越了 ChatGPT,攀升至榜首位置。
2/24/2025 10:07:10 AM
派大星
DeepSeek 开源周首日:开源 FlashMLA,AI 推理速度再进化!
DeepSeek 开源周day1 推出 FlashMLA! 专为Hopper 架构 GPU打造的 超高效 MLA (Multi-Layer Attention) 解码内核,现在已经正式开源啦! 👏什么是 FlashMLA?
2/24/2025 10:07:04 AM
AI寒武纪
超1/3美国大学生用ChatGPT,用户数激增破4亿!AI重塑教育职场
OpenAI发布了最新报告,揭示了一个引人注目的趋势:美国超过三分之一的大学生正在使用ChatGPT。 他们借助这一工具撰写论文、开展项目研究、探索主题,甚至进行创意头脑风暴。 与此同时,AI技能已成为企业青睐人才的重要标准。
2/24/2025 9:35:00 AM
新智元
RAGFlow+DeepSeek-R1:14b落地案例分享(足够详细):机加工行业设备维保场景
看到一个段子说,春节开工以后,中国有 5000 万家企业老板担心会错过 DeepSeek。 虽然感觉有点瞎玩梗,但 DeepSeek 无疑已是当下所谓大模型企业应用落地的"房间里的大象"。 不过想想,其实子弹也才刚刚飞了一个月而已。
2/24/2025 9:33:10 AM
韦东东
DeepSeek热度正盛,被神话还是确有实力?
2025年年初,中国初创公司DeepSeek以一种近乎现象级的速度崛起,引发了全球科技界的热议。 其模型在苹果应用商店的下载量超越ChatGPT、训练成本仅为竞争对手的零头、技术能力被冠以“颠覆性”标签……这些标签让DeepSeek迅速成为舆论焦点。 然而,在铺天盖地的赞誉与争议中,一个核心问题亟待回答:DeepSeek的“神话”究竟是资本市场的造势,还是AI实力的真实体现?
2/24/2025 8:28:30 AM
Yu
如何用 11 款 AI 工具让工作效率提升 300 倍
爱因斯坦有句名言:「如果还在重复做同样的事情,却期待会有不同结果,那么就等于疯狂。 」如果想在接下来的日子里提高效率,不妨往下看看。 Promptmetheus —— 不再花时间“修饰”Promptimage.png如果你玩过 ChatGPT,就知道写出好的 Prompt 有时像玄学。
2/24/2025 8:24:39 AM
dev
忘掉 DeepSeek:Qwen 2.5 VL 与 Qwen Max 来了
Qwen 系列又推出了两款令人瞩目的新模型:Qwen 2.5 VL 和 Qwen 2.5 Max。 如果还停留在“DeepSeek 是最强”那一档,就可能要重新考虑一下,因为这两款模型的实力相当惊艳。 什么是 Qwen 2.5 VL?
2/24/2025 8:10:00 AM
de
2025最新版DeepSeek保姆级安装教程:本地部署+避坑指南
本文旨在提供一个全面且详细的DeepSeek本地部署指南,帮助大家在自己的设备上成功运行DeepSeek模型。 无论你是AI领域的初学者还是经验丰富的开发者,都能通过本文的指导,轻松完成DeepSeek的本地部署。 一、本地部署的适用场景DeepSeek本地部署适合以下场景:高性能硬件配置:如果你的电脑配置较高,特别是拥有独立显卡和足够的存储空间,那么本地部署将能充分利用这些硬件资源。
2/24/2025 12:00:09 AM
DeepSeek R-1 能否解答这五道“刁钻”AI 问题?
每当有新的语言模型公开发布时,我总会忍不住拿它来做一些看似简单、实则暗藏难点的小测试。 我把这当作给模型做“压力测试”,用来检验它们在逻辑推理上到底行不行。 DeepSeek R-1 刚发布不久,就因为它是开源、且推理能力强大而备受关注。
2/24/2025 12:00:00 AM
dev
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
Anthropic
论文
代码
AI新词
训练
算法
Stable Diffusion
芯片
LLM
蛋白质
开发者
腾讯
Claude
苹果
生成式
AI for Science
Agent
神经网络
3D
机器学习
研究
xAI
生成
人形机器人
AI视频
计算
百度
Sora
GPU
AI设计
华为
工具
大语言模型
RAG
搜索
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
视频生成
伟达
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用