应用
月之暗面推出新优化器Muon,计算效率大幅提升
近日,人工智能领域再度掀起波澜,月之暗面(Moonshot)宣布开源新版优化器 Muon,成功将计算效率提升至传统 AdamW 的两倍。 这个新优化器的推出恰逢 DeepSeek 即将连续开源多个代码库,引发了业内的高度关注和讨论。 Muon 优化器最初由 OpenAI 的研究者 Keller Jordan 等人在2024年提出,针对小规模模型训练时表现优异。
2/24/2025 3:53:00 PM
AI在线
苹果面临股东施压,捍卫多样性政策与 OpenAI 合作
近年来,苹果公司在多样性和包容性(DEI)政策方面的坚持,正遭遇部分股东的挑战。 作为硅谷中少数对抗保守派势力的公司之一,苹果在维护其多样性政策的同时,也面临来自股东的质疑和施压。 股东们希望公司能重新审视这些政策,认为它们可能会对公司的业绩产生影响。
2/24/2025 2:55:00 PM
AI在线
梁文锋亲自挂名,DeepSeek 最新论文丢出注意力新机制,推理速度直线提升 11 倍
2 月 18 日,马斯克发布 Grok 3 的热度还没过去,梁文锋就作为 co-authors 带着 DeepSeek 研究团队杀了回来。 公布新研究的推文发布不到 3 个小时,就带来了三十多万的浏览量,火爆程度不逊 OpenAI。 而这次 DeepSeek 团队最新的研究论文更是重磅,论文中介绍了一种全新的,可用于超快速的长上下文训练与推理的注意力机制 —— NSA,值得一提的是,NSA 还具有与硬件对齐的特点,十足的硬件友好。
2/24/2025 2:14:00 PM
郑佳美
腾讯健康接入DeepSeek+腾讯混元双模型 升级就医体验
2月24日,腾讯健康宣布通过腾讯云全面接入DeepSeek大模型,并与腾讯自研的混元大模型“双核组队”,全面升级医疗服务,涵盖智能导诊、预问诊、健康问答、智能用药、症状自查、影像报告解读及质控等多个场景。 这一升级旨在帮助全国超过1000家医院快速提升智能应用水平,并为医疗机构、体检中心、药械企业和基因测序企业提供多模型部署及应用方案。 此次升级围绕就医全流程展开,从诊前的健康问答、症状自查和智能导诊,到诊中的智能预问诊,再到诊后的报告解读和智能用药,腾讯健康正逐步将服务切换至“多模型”模式。
2/24/2025 2:02:00 PM
AI在线
YY 语音公司接入 DeepSeek 上线“YYDS”
YY 公司今日宣布接入 DeepSeek,并推出“低延时、不卡顿”的 YY-DeepSeek R1-满血版(简称“YYDS”),旗下 YY 直播、YY 语音等产品已经上线产品入口。
2/24/2025 12:03:23 PM
汪淼
OpenAI 员工公开质疑 xAI:Grok 3 基准测试结果存在误导
近期,关于人工智能基准测试的争论在公众视野中愈演愈烈。 OpenAI 的一名员工指责马斯克创办的 AI 公司 xAI 发布了误导性的 Grok3基准测试结果,而 xAI 的联合创始人伊戈尔・巴布申金则坚称公司没有问题。 事件的起因是 xAI 在其博客上发布了一张图表,展示了 Grok3在 AIME2025测试中的表现。
2/24/2025 11:26:00 AM
AI在线
传音 Infinix 接入满血版 DeepSeek-R1,推动 AI 智能手机新体验
近日,传音控股旗下的 Infinix 品牌宣布,将其智能手机系列接入 DeepSeek-R1满血版 AI 技术。 根据官方消息,从2月26日起,支持 XOS14.5及以上版本的 Infinix 手机用户可通过系统升级体验这一全新功能。 此外,传音还透露,将于3月份发布的全新 NOTE 系列手机也将搭载 DeepSeek-R1。
2/24/2025 10:58:00 AM
AI在线
苹果扩展AI合作版图:Gemini有望加入Apple Intelligence
据国外媒体报道,苹果公司可能正计划将谷歌的Gemini AI模型整合进其Apple Intelligence系统。 这一消息源自固件分析师Aaron Perris对iOS18.4首个测试版的代码研究,他发现了后端代码中新增了将"谷歌"作为第三方模型选项的相关引用。 这一发现与苹果此前的战略布局相呼应。
2/24/2025 10:50:00 AM
AI在线
刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中
上周五,DeepSeek 发推说本周将是开源周(OpenSourceWeek),并将连续开源五个软件库。 第一个项目,果然与推理加速有关。 北京时间周一上午 9 点,刚一上班(同时是硅谷即将下班的时候),DeepSeek 兑现了自己的诺言,开源了一款用于 Hopper GPU 的高效型 MLA 解码核:FlashMLA。
2/24/2025 10:28:00 AM
机器之心
DeepSeek 开源周首日:发布大模型加速利器FlashMLA 解码性能飙升至3000GB/s
DeepSeek 开源周首日正式开源其最新技术成果FlashMLA,这是一款专为英伟达Hopper架构GPU打造的高效多层注意力(Multi-Layer Attention)解码内核。 该技术特别针对变长序列场景进行优化,可显著提升大模型推理性能。 FlashMLA的核心技术特性包括对BF16精度的全面支持,以及采用块大小为64的页式键值缓存(Paged KV Cache)系统,实现更精确的内存管理。
2/24/2025 10:18:00 AM
AI在线
DeepSeek 代码库开源进度 1/5:为 Hopper GPU 优化的高效 MLA 解码内核 FlashMLA
DeepSeek今日启动“开源周”,首个开源的代码库为FlashMLA——针对 Hopper GPU 优化的高效 MLA 解码内核,支持可变长度序列。
2/24/2025 9:47:40 AM
清源
黄仁勋怒怼市场 “你们都搞错了!”:DeepSeek R1 不是来砸场子, 反而是 Nvidia 的 “神助攻”
“你们都搞错了!” 近日, 英伟达掌门人 罕见 “ 动怒 ” , 公开回应了市场对中国 AI 创企 DeepSeek 发布 R1模型的 “ 过度 ” 反应。 在黄仁勋看来, DeepSeek R1的 横空出世非但不是 对 Nvidia 的 “ 饭碗 ” 构成 威胁, 反而是加速AI发展的重大利好, 对英伟达而言 更是 “ 神助攻 ” 一般的存在。 事情起因于今年1月 DeepSeek 发布 R1模型 后, 市场普遍认为 R1的高效性意味着未来AI发展将不再需要如此庞大的算力资源, 这直接导致Nvidia股价单日暴跌16.9%, 市值瞬间蒸发数百亿美元。
2/24/2025 9:47:00 AM
AI在线
DeepSeek-R1 登顶 Hugging Face:以10000 赞力压 150 万个模型
今日凌晨,全球最大开源平台之一 Hugging Face 的首席执行官 Clement Delangue 在社交平台发文宣布,DeepSeek-R1在 Hugging Face 上获得了超过10000个赞,成为该平台近150万个模型中最受欢迎的大模型。 这一里程碑式的成就标志着 DeepSeek-R1在全球 AI 社区中的广泛认可与影响力。 DeepSeek-R1的崛起速度令人瞩目。
2/24/2025 9:30:00 AM
AI在线
OpenAI 最新研究揭示:最先进的 AI 仍难以解决编码问题
近日,OpenAI 的研究人员在一篇新发布的论文中坦言,尽管目前的 AI 技术已经相当先进,但这些模型依然无法与人类程序员相媲美。 OpenAI 首席执行官山姆・阿尔特曼曾表示,预计到今年底,AI 将能够战胜 “低级” 软件工程师,但研究结果却显示,这些 AI 模型仍然面临重大挑战。 图源备注:图片由AI生成,图片授权服务商Midjourney在研究中,OpenAI 团队使用了一种名为 SWE-Lancer 的新基准测试,评估了从自由职业网站 Upwork 上提取的1400多项软件工程任务的表现。
2/24/2025 9:09:00 AM
AI在线
超 20 家央企接入 DeepSeek,涉及能源、通信、汽车等领域
据经济参考报报道,近来,国资央企“牵手”DeepSeek 已成为一股新风潮。据不完全统计,目前有超 20 家央企接入 DeepSeek,涉及能源、通信、汽车、金融、建筑等多个领域。
2/24/2025 8:56:11 AM
远洋
内测即爆火!一键超清修复老视频的AI神器Starlight
经常有群友问我有没有什么把视频修复的工具。 而我过去最推荐的,也是我心中目前最牛逼的视频修复工具,自然就是 TopazVideoAI 了。 这玩意儿我 2023 年就写过教程。
2/24/2025 8:28:15 AM
卡兹克
DeepSeek-R1 成 Hugging Face 最受欢迎大模型,力压近 150 万个“对手”
Clement Delangue今日凌晨发文宣布:DeepSeek-R1在Hugging Face上获得了超过10000个赞,成为该平台近150万个模型之中最受欢迎的大模型,“太令人震惊了!”
2/24/2025 7:59:13 AM
清源
彻底解放双手!如何用DeepSeek结合Stable Diffusion快速出图?
我们热衷探索 Stable Diffusion 是因为它的开源生态与极大的自由度和控制力。 尽管 Stable Diffusion 在图像控制精度上远超 Midjourney,但其复杂操作流程总让创作者望而却步。 然而,最近情况出现了转机。
2/24/2025 6:34:36 AM
Infinite AI
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
Gemini
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind