文章列表
DeepSeek太给力了!自家的大模型秘方开源到底!国产大模型雄起
出品 | 51CTO技术栈(微信号:blog51cto)DeepSeek “开源周”第五天,依旧保持了一如既往地“务实”风,满满的诚意。 先来回忆下前四天,源神的慷慨发布——第一天,2月24日,最为外界称道的MLA技术率先开源,这项解码加速器FlashMLA技术能够让英伟达Hopper架构GPU跑得更快,效果更好! 紧接着,25日,直接亮出首个面向MoE模型的开源专家并行通信库DeepEP,实现了MoE训练推理的全栈优化;第三天,则进一步祭出一项跨时代的发布:FP8通用矩阵乘法加速库,从底层让模型训练、微调变得更加流畅丝滑;第四天,也就是昨天的并行优化“三剑客”:DeepSeek-V3和R1 模型背后的并行计算优化技术——DualPipe(双向流水线并行算法,让计算和通信高效协同)、EPLB ( 专家并行负载均衡器,让每个 GPU 都“雨露均沾”)、profile-data (性能分析数据,可以理解成V3/R1 的并行优化的分析经验)可以说前四天的发布聚焦在算力通信、模型架构优化,也就是算力和算法的层面,而接下来第五天的开源则补上了AI三驾马车的最后一块,也是用户体验感知更为明显的一块优化动作:高性能分布式文件系统(数据存储层面的改进)。
2/28/2025 12:32:42 PM
DeepSeek开源周最后一天:让数据处理「从自行车升级到高铁」
DeepSeek 的开源周终于迎来了最后一天。 今天他们开源了一个名为 3FS(Fire-Flyer File System)的系统。 这是一种并行文件系统,它利用现代固态硬盘(SSD)和远程直接内存访问(RDMA)网络的全部带宽,能够加速和推动 DeepSeek 平台上所有数据访问操作。
2/28/2025 10:36:25 AM
机器之心
81%的美国人对AI说“不”:科技圈的“打脸”时刻?
在科技巨头们纷纷砸下重金布局人工智能的时代,你有没有想过,那些身处职场的美国上班族们,到底有没有把AI用起来呢? 最近,皮尤研究中心的一项调查给出了答案:大多数美国人,其实还在AI的门外徘徊。 这项调查在2024年10月进行,涵盖了5273名美国在职成年人。
2/28/2025 10:16:13 AM
舒云
GPT-4.5发布:价格飙升30倍 能力提升引发热议
2025 年 2 月 27 日,OpenAI正式发布了其最新聊天模型GPT-4.5,这一消息迅速在Twitter(现为X平台)上引发了广泛讨论。 作为OpenAI迄今为止最强大的对话模型,GPT-4. 5 在性能上实现了显著突破,但其高昂的价格也让用户和开发者们议论纷纷。
2/28/2025 10:09:32 AM
AI在线
DeepSeek 开源进度 5/5:高性能并行文件系统 3FS 实现聚合吞吐 6.6 TiB/s
2 月 28 日消息,DeepSeek 在开源周第五天发布了 3FS(Fire-Flyer File . System),这是一个专为充分利用现代 SSD 和 RDMA . 网络带宽而设计的并行文件系统,具备惊人的数据访问性能,为深度学习等数据密集型应用提供了强大的支持。
2/28/2025 10:01:06 AM
故渊
Alexa 全面升级,正式接入大模型,挑战AI助手新格局
日前,亚马逊宣布其语音助手 Alexa 正式接入大模型,推出了名为 Alexa 的新版功能。 这一更新使 Alexa 不仅仅是一款智能音箱,更向智能助手的多元化发展迈出了重要一步。 Alexa 的订阅费用为每月19.99美元,但亚马逊 Prime 会员可以免费使用。
2/28/2025 9:41:00 AM
AI在线
“嘎子哥”谢孟伟开卖 AI 课,宣称 DeepSeek 引爆流量
随着生成式 AI 行业以及国产 DeepSeek 模型的爆火,直播带货行业也开始向 AI 靠拢。2 月 26 日有网友发布视频,曾主演《小兵张嘎》的演员“嘎子哥”谢孟伟有了新的直播方向。
2/28/2025 9:38:06 AM
汪淼
疯了!居然有人试图让我搞懂,什么是 DeepGEMM
DeepSeek开源周,继DeepEP之后,开源了第三弹DeepGEMM。 今天简单来说说:吃瓜:DeepGMEE是干嘛的? 技术:DeepGMEE是怎么做到的?
2/28/2025 9:30:00 AM
58沈剑
刚刚,GPT-4.5问世!OpenAI迄今最大、最贵模型,API价格飞涨30倍,不拼推理拼情商
大家心心念念的 GPT-4.5 终于来了! 凌晨 4 点,OpenAI 开始了直播,奥特曼并没有现身。 直播不到 15 分钟就匆匆结束了。
2/28/2025 9:25:00 AM
机器之心
奥尔特曼坦诚 OpenAI 急缺 GPU,GPT-4.5 只能分阶段推出
GPT-4.5是一个“庞大”且“昂贵”的模型,需要数万个额外的GPU才能向更多ChatGPT用户开放。GPT-4.5将首先推向ChatGPT Pro订阅者,随后将在下周向ChatGPT Plus用户推出。
2/28/2025 9:24:05 AM
清源
尴尬!OpenAI CEO称内部GPU短缺,GPT-4.5发布将分阶段进行
日前,,OpenAI 首席执行官山姆・阿尔特曼(Sam Altman)在社交平台 X 上宣布,因公司 GPU 资源耗尽,最新模型 GPT-4.5的发布将被迫采取分阶段的方式。 阿尔特曼表示,GPT-4.5的规模巨大且成本高昂,因此需要 “成千上万” 的 GPU 才能支持更多的 ChatGPT 用户接入该模型。 据悉,GPT-4.5将首先向 ChatGPT Pro 的订阅用户开放,预计于本周四启动。
2/28/2025 9:03:00 AM
AI在线
DeepSeek“出圈”了,鹅厂人怎么看?
话题背景在人工智能领域,大型语言模型的快速发展引发了无数关于技术革新和未来趋势的讨论。 随着各类AI技术的不断突破,越来越多的创新模型开始崭露头角,而最近备受关注的DeepSeek更是成为了热议的焦点。 它被一些人称为“AI技术的重大突破”,甚至被认为是下一代人工智能发展的重要方向。
2/28/2025 9:00:00 AM
腾讯技术工程
GPT-4.5正式亮相:OpenAI推出迄今最强大聊天模型
OpenAI今日宣布,其最新聊天模型GPT-4.5正式进入研究预览阶段。 这一模型被誉为OpenAI迄今为止“最大且最佳”的聊天AI,并已开始向ChatGPT Pro用户逐步推出。 根据官方声明,GPT-4.5将在下周扩展至Plus和Team用户,随后于下下周覆盖Enterprise和Edu用户。
2/28/2025 8:52:00 AM
AI在线
任意Prompt就能给大模型实时排名!竞技场新玩法,还能自动找最佳AI来作答
给大模型排名这事儿,现在有了新玩法——任意输入一个Prompt,就能给大模型们实时排名,精准找到最适合做这个Prompt的大模型! 这就是竞技场(lmarena.ai)最新推出的排名方式,叫做Prompt-to-leaderboard(P2L)。 主打的就是找到最能直击你Prompt“灵魂”的那款大模型。
2/28/2025 8:40:00 AM
量子位
OpenAI 发布 GPT-4.5:迄今最强大模型亮相 强化推理与情感智能
2025年2月27日—— OpenAI 于今日正式推出其最新语言模型 GPT-4.5,作为研究预览版率先提供给 ChatGPT Pro 用户(每月订阅费200美元)。 这款被誉为“迄今为止最大、最知识渊博”的模型基于 GPT-4o 构建,在推理能力、情感智能以及写作、编程等实用功能上实现显著提升。 OpenAI 表示,未来几周内,GPT-4.5将逐步开放给 Plus、Team、Enterprise 和 Edu 用户,标志着人工智能技术的又一里程碑。
2/28/2025 8:22:00 AM
AI在线
OpenAI正式发布GPT-4.5 率先向ChatGPT Pro用户开放
2月28日,OpenAI通过官方博文宣布,其最新研发的GPT-4.5AI模型已正式亮相。 这款模型被OpenAI标榜为其目前最大、表现最佳的聊天模型,并将以研究预览版的身份率先向ChatGPT Pro用户开放体验。 GPT-4.5在预训练和后训练规模上进行了显著扩大,这一改变直接提升了其非监督学习能力。
2/28/2025 7:55:00 AM
AI在线
OpenAI 奥尔特曼幽默回应 Meta 拟推独立 AI 应用:也许我们该做社交 App 了
“哈哈!如果Facebook想对付我们,我们直接用UNO牌反将一军,想想都有趣!”
2/28/2025 7:43:27 AM
清源
GPT-4.5 登场:OpenAI 最强、最佳 AI 聊天模型,更睿智、更高“情商”、更少幻觉
OpenAI今日正式推出GPT-4.5 AI模型,声称是其最大、最佳的聊天模型。GPT-4.5通过扩大预训练和后训练规模,提升了非监督学习能力,在理解模式、建立联系和生成创意方面取得了重大进步。早期测试表明,与GPT-4.5的交互更自然,知识库更广,更能理解用户意图,并且“情商”更高,有助于改进写作、编程和解决实际问题,同时减少“幻觉”现象。GPT-4.5将首先面向ChatGPT Pro用户开放,下周将推广到Plus和Team用户。 #AI #OpenAI #GPT4.5
2/28/2025 6:23:41 AM
故渊