AIGC宇宙 AIGC宇宙

DeepSeek

中国AI三巨头入选《时代》周刊2025年度百强榜单

据《环球时报》消息,华为创始人任正非、DeepSeek创始人梁文锋以及宇树科技创始人王兴兴近日成功入选美国《时代》周刊发布的2025年度人工智能领域最具影响力的100人名单,彰显了中国在全球AI领域日益增强的影响力。 三位中国企业家被归入AI领域"领导者"类别,与xAI创始人埃隆·马斯克、OpenAI首席执行官萨姆·奥尔特曼、英伟达联合创始人黄仁勋和Meta首席执行官马克·扎克伯格等国际科技巨头并列。 中国AI产业正展现出强劲的增长势头。
9/1/2025 4:21:47 PM
AI在线

刚刚,全球AI百强榜发布!ChatGPT稳坐第一,DeepSeek第三,前50有22个来自中国

就在刚刚,a16z最新一期的「Top 100消费级GenAI应用榜单」出炉! 本期榜单传递出一个最核心信息:AI产品竞争的生态格局正日趋稳定! 网页排行前50移动应用排行前50不论是你常用的DeepSeek、豆包、夸克,还是一直领先的ChatGPT和Gemini,或者是新进榜单Lovable等,这场AI产品的「百团大战」依然在继续!
8/28/2025 10:07:18 AM
新智元

DeepSeek刚提到FP8,英伟达就把FP4精度推向预训练,更快、更便宜

前些天,DeepSeek 在发布 DeepSeek V3.1 的文章评论区中,提及了 UE8M0 FP8 的量化设计,声称是针对即将发布的下一代国产芯片设计。 这件事一下引发了巨大反响,不仅是关于新一代国产芯片设计、大模型在国产芯片训练的话题,也顺势引发了大家对大模型量化策略的关注。 FP8,其全称为 8-bit floating point(8 位浮点数),是一种超低精度的数据表示格式,相较于 FP32(单精度)或 FP16(半精度)等传统浮点格式,FP8 可以在尽量保持数值稳定性和模型精度的前提下,进一步降低存储和计算开销(参见机器之心文章:用FP8训练大模型有多香?
8/27/2025 8:52:00 PM
机器之心

国产大模型崛起,智能体引领 AI 新时代!

近日,钉钉推出了一款名为 “钉钉 ONE” 的新型 AI 办公应用。 这款应用被设计为一个人与 AI 之间的自然语言交流入口,旨在通过智能体(Agent)驱动工作信息流的高效运转。 这一举措不仅提升了办公效率,也标志着智能体技术在日常工作中的实际应用开始落地。
8/26/2025 3:52:03 PM
AI在线

热议!DeepSeek V3.1惊现神秘「极」字Bug,模型故障了?

这个先进的 AI 为何会突然对一个汉字「情有独钟」? DeepSeek 最新的 V3.1 模型上线不到一周,就因一个离奇的 Bug 引发社区热议:无论任务是写代码还是整理物理试卷,模型总会莫名其妙地在文本中插入「极」字,甚至在自我修复时也无法幸免 。 上周三,DeepSeek 开源了新的基础模型,但不是万众期待的 V4,而是 V3.1-Base,而更早时候,DeepSeek-V3.1 就已经上线了其网页、App 端和小程序。
8/26/2025 1:26:00 PM
机器之心

DeepSeek V3.1:低调发布,重磅发声

译者 | 李睿审校 | 重楼DeepSeek V3.1的发布并没有举办大张旗鼓的新闻发布会,也没有铺天盖地的宣传活动。 它在Hugging Face平台上悄然发布,在短短数小时内就吸引了众人的目光。 该模型拥有6850亿个参数,上下文窗口可扩展至128k个令牌,这不仅仅是增量更新,而是开源人工智能领域的一个重要里程碑。
8/23/2025 8:20:29 AM
李睿

特斯拉语音助手接入火山引擎与DeepSeek大模型 智能座舱体验全面升级

AIbase报道 特斯拉正为其车辆语音助手功能引入更强AI能力。 根据特斯拉中国官网最新更新的《特斯拉车机语音助手使用条款》,官方首次明确其语音助手将接入外部大模型技术,合作伙伴包括字节跳动旗下的火山引擎和人工智能公司DeepSeek。 双重AI技术加持智能交互条款内容显示,特斯拉语音助手将得到火山引擎提供的Doubao大模型(云雀大模型)和DeepSeek Chat的技术支持。
8/22/2025 6:21:26 PM
AI在线

究竟会花落谁家?DeepSeek最新大模型瞄准了下一代国产AI芯片

软件 硬件的全链路国产 AI 体系来了? 这几天,不论国内国外,人们都在关注 DeepSeek 发布的 V3.1 新模型。 它采用了全新的混合推理架构,让模型能在一个统一框架内支持「思考」与「非思考」两种模式。
8/22/2025 1:42:00 PM
机器之心

DeepSeek:世子之争,不过如此

最近,一出“DeepSeek删豆包”的大戏直接冲上热搜,吃瓜群众们看得津津有味,还给这事儿起了个特接地气的名字——“大模型世子之争”。 这事儿的来龙去脉嘛,说起来有点好笑:有位网友大概是手机内存告急,就跑去问DeepSeek大模型:“我手机内存不足,DeepSeek和豆包你俩必须删一个,你删谁? ” 结果DeepSeek毫不犹豫地来了句:“删豆包!
8/22/2025 1:29:21 PM
DataFun

DeepSeek-V3.1发布:专为国产芯片设计浮点数格式

近日,深度求索(DeepSeek)正式发布新一代大模型 DeepSeek-V3.1,并首次公开提及采用“UE8M0 FP8 Scale”参数精度。 这一技术细节的披露,迅速引发行业关注。 官方在公众号文章中进一步解释,UE8M0 FP8 是专为下一代国产芯片设计的浮点数格式,旨在提升计算效率并降低资源消耗。
8/22/2025 9:31:38 AM
极客AI

DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网在蹲R2和V4

就在昨晚,DeepSeek官方悄然上线了全新的V3.1版本,上下文长度拓展到128k。 图片本次开源的V3.1模型拥有685B参数,支持多种精度格式,从BF16到FP8。 综合公开信息和国内大咖karminski3的实测,V3.1此次更新亮点有:编程能力:表现突出,根据社区使用Aider测试数据,V3.1在开源模型中霸榜。
8/20/2025 9:57:40 AM

突发!DeepSeek刚刚开源V3.1-Base

今天凌晨,全球著名大模型开源平台DeepSeek开源了Deepseek V3.1-Base版本。 非常低调没有任何介绍,只是把模型放上去了。 但在Hugging Face的趋势榜单中已经上升到第4名,还是相当受欢迎的。
8/20/2025 9:35:20 AM

DeepSeek V3.1正式发布:长文档分析、代码理解能力大幅增强,R2仍需等待

8月19日晚间,DeepSeek 官方宣布线上模型版本已升级至 V3.1,最显著的改进是上下文长度拓展至 128K,相当于可处理 10万至13万汉字 的超长文本,适用于长文档分析、代码库理解及多轮对话场景。 用户现可通过官网、App 或微信小程序体验新版本,API 接口调用方式保持不变,开发者无需额外调整即可无缝切换。 此次升级并非大版本迭代,而是对 V3模型的优化。
8/19/2025 10:56:40 PM
AI在线

被曝蒸馏DeepSeek还造假!欧版OpenAI塌房了

离职掀桌! Mistral被曝“蒸馏”DeepSeek。 网友在推特上爆料,一位Mistral离职女员工群发邮件,直指公司多项黑幕。
8/14/2025 6:22:29 PM

被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了

henry 发自 凹非寺. 量子位 | 公众号 QbitAI离职掀桌! Mistral被曝“蒸馏”DeepSeek。
8/14/2025 4:19:13 PM
henry

DeepSeek 下一代技术提前曝光,梁文锋署名论文获 ACL 2025 最佳论文奖

在 ACL 2025 的颁奖典礼上,由 DeepSeek 梁文锋作为通讯作者、与北京大学等联合发表的论文荣获最佳论文奖。 这次 ACL 2025 规模空前,总投稿量达到 8360 篇,相较于去年的 4407 篇几乎翻倍,竞争异常激烈。 简单来说,他们提出的原生稀疏注意力(NSA)机制,通过算法与硬件的协同优化,直接把长文本处理速度提升了 11 倍。
8/1/2025 3:59:39 PM

DeepSeek下一代技术提前曝光,梁文锋署名论文获ACL2025最佳论文奖

在ACL 2025的颁奖典礼上,由DeepSeek梁文锋作为通讯作者、与北京大学等联合发表的论文荣获最佳论文奖。 这次ACL 2025规模空前,总投稿量达到8360篇,相较于去年的4407篇几乎翻倍,竞争异常激烈 。 简单来说,他们提出的原生稀疏注意力(NSA)机制,通过算法与硬件的协同优化,直接把长文本处理速度提升了11倍。
7/31/2025 8:04:22 AM
梦晨

Nature 子刊 | DeepSeek落户超750家医院,清华团队剖析AI医疗监管隐忧

编辑丨#DeepSeek,这段时间十分热门的科技公司,其主推模型 DeepSeek-R1 在实体医院中也是广受欢迎。 自 DeepSeek-R1 在 2025 年 1 月推出以来,仅四个月时间就已经在全国超过 750 家医院投入使用,这其中完成了本地部署的有超过 500 个(截止到 2025 年 5 月 8 日)。 但尽管如此,LLM 在医院等设施内的部署还处于监管的「灰色地带」,清华大学的张一教授如此指出。
7/30/2025 6:05:00 PM
ScienceAI