大模型
英伟达年终核弹!全新B300为o1推理大模型打造,RTX5090也曝光了
英伟达老黄,成了今年的圣诞老黄。 AI芯片大礼包刚刚曝光:GPU新核弹B300,以及附带CPU的超级芯片GB300。 高算力,在产品层面上相比B200在FLOPS上提高50%大显存,从192GB提升到288GB,也是提高了50%。
12/26/2024 11:45:48 AM
o3挑战ARC-AGI,遇见大网格就懵圈?英国工程师:ARC-AGI不适合大模型
o3在超难推理任务ARC-AGI上的成绩,属实给人类带来了不少震撼。 但有人专门研究了它不会做的题之后,有了更有趣的发现——o3之所以不会做这些题,原因可能不是因为太难,而是题目的规模太大了。 来自英国的ML工程师Mikel Bober-Irizar(不妨叫他米哥),对ARC题目进行了细致观察。
12/26/2024 11:42:56 AM
网页多模态建模思考
1.综述网页本质上是一种超文本,一般由超文本标记语言来定义(例如HTML)。 HTML是一种基础技术,常与CSS、JavaScript一起被众多网站用于设计网页、网页应用程序以及移动应用程序的用户界面 。 网页浏览器内核通过解释HTML文件,通过视觉引擎将其渲染成可视化网页。
12/26/2024 1:20:53 AM
百度Geek说
机器学习|从0开始大模型之模型LoRA训练
1、LoRA是如何实现的? 在深入了解 LoRA 之前,我们先回顾一下一些基本的线性代数概念。 1.1、秩给定矩阵中线性独立的列(或行)的数量,称为矩阵的秩,记为 rank(A) 。
12/26/2024 12:46:25 AM
周末程序猿
Bolt.new vs Cursor ,怎么选?
大家好,我是汤师爷~这篇聊聊 Bolt.new 和 Cursor 的对比。 图片Bolt.new 是一款基于 SaaS 的 AI 编码平台。 它由 LLM 驱动的智能体作为底层,并结合 WebContainers 技术,让用户可以直接在浏览器中进行编码和运行。
12/26/2024 12:38:10 AM
架构师汤师爷
TurboAttention:基于多项式近似和渐进式量化的高效注意力机制优化方案,降低LLM计算成本70%
随着大型语言模型(LLMs)在AI应用领域持续发展,其计算成本也呈现显著上升趋势。 数据分析表明,GPT-4的运行成本约为700美元/小时,2023年各企业在LLM推理方面的总支出超过50亿美元。 这一挑战的核心在于注意力机制——该机制作为模型处理和关联信息的计算核心,同时也构成了主要的性能瓶颈。
12/25/2024 4:42:18 PM
Tim Urista
大模型版生命游戏来了!「AI科学家」背后公司联手MIT&OpenAI等打造
大模型版生命游戏来了。 ALife,即人工生命,旨在通过人工手段研究生命和类生命过程。 程序员们深深着迷的康威生命游戏,就属于这一研究领域。
12/25/2024 3:36:44 PM
国产AI之光!TeleAI星辰大模型入选央企十大国之重器评选
近日,国务院国资委新闻中心发起“十大国之重器”年度盘点,从2024年中央企业建设的众多重点项目中精心选出20项既有影响力又有创新力的大国重器,诚邀广大网友评选“年度十大国之重器”。 由中电信人工智能科技有限公司和中国电信人工智能研究院(TeleAI)打造的“全国产化万亿参数星辰大模型发布”光荣入选,成为国产AI的佼佼者,展现了中国电信在人工智能领域的领先地位。 星辰大模型,开启国产AI新时代星辰大模型,是由中国电信自主研发打造的全国产化万亿参数大模型,是国内AI技术的重大突破。
12/25/2024 2:50:00 PM
新闻助手
基座大模型「六进二」:南阶跃,北智谱
作者丨陈彩娴今天消息,阶跃星辰完成了 B 轮融资,总融资金额达数亿美元。 AI 科技评论获悉,此次融资有国资、战略和财务投资人等多家参与,核心投资方包括上海国有资本投资有限公司及其旗下基金,战略和财务投资人包括腾讯投资、五源资本、启明创投等。 据了解,这笔融资将用于继续投入基础模型研发,强化多模态和复杂推理能力,并通过产品和生态加大覆盖 C 端应用场景,提供丰富的用户体验。
12/25/2024 2:38:00 PM
陈彩娴
OpenAI被曝自研人形机器人,四年前因缺数据解散团队,如今要用机器人数据反哺大模型了
o3之后,OpenAI下一个项目曝光了:人形机器人这次不只是投资像Figure、1x和Physical Intelligence这样的机器人初创公司,也不只是算法团队搞机器人强化学习。 而是自己涉足硬件,研发有双臂、双腿的实体人形机器人。 Information的消息称,两位直接了解这个项目的人透露了这个消息。
12/25/2024 10:58:29 AM
谷歌被曝正使用 Anthropic 的 Claude 模型来改进其 Gemini AI
据 TechCrunch 获得的内部通信内容显示,参与改进谷歌 Gemini 人工智能模型的承包商正在将其答案与 Anthropic 的竞品模型 Claude 的输出进行比较。此举引发了谷歌是否获得 Anthropic 授权使用 Claude 进行测试的合规性质疑。
12/25/2024 9:28:55 AM
远洋
时隔6年BERT升级!仅编码器架构没被杀死,更快更准确更长上下文
时隔6年,一度被认为濒死的“BERT”杀回来了——更现代的ModernBERT问世,更快、更准、上下文更长,发布即开源! 去年一张“大语言模型进化树”动图在学术圈疯转,decoder-only枝繁叶茂,而曾经盛极一时的encoder-only却似乎走向没落。 ModernBERT作者Jeremy Howard却说:encoder-only被低估了。
12/24/2024 3:30:00 PM
量子位
OpenAI被曝数据崩溃GPT-5难产,团队抢算力冲突激烈!Ilya预言成真?
OpenAI轰轰烈烈搞出一场12天圣诞特别活动,结果期间发布最轰动成果的,居然是谷歌。 谷歌一发发密集的核弹,让OpenAI分成12天的挤牙膏黯然失色,毫无还手之力。 原生多模态Gemini 2.0 Flash,demo惊艳的Project Astra,组团出道的AI智能体,效果吊打Sora掀起全网狂潮的Veo 2……显得OpenAI的圣诞活动仿佛是个笑话。
12/24/2024 2:30:00 PM
新智元
近1.4万星,腾讯混元大模型开源成绩单公布,多次登顶开源趋势热榜
记者获悉,腾讯云副总裁,腾讯混元大模型负责人刘煜宏在2024开放原子开发者大会暨首届开源技术学术大会上表示,腾讯将开源协同作为公司的核心技术战略,积极推动内外部技术开源共享。 腾讯混元大模型语言大模型、文生图大模型、文生3D大模型以及文生视频大模型等多个模态模型均已开源,未来大模型各版本也将进一步开源,与社区开发者一起共同推动技术生态繁荣发展。 (腾讯云副总裁,腾讯混元大模型负责人 刘煜宏)腾讯混元大模型的开源模型已经全面覆盖文生文、文生图、文生3D以及文生视频多个模态,是开源系列模型中较全的,其模型性能也得到了开源社区的高度认可,总GitHub Star(星星)数量近1.4万颗,并且多次登顶趋势榜。
12/24/2024 11:17:00 AM
新闻助手
使用LLaMA 3.1、Firebase和Node.js,构建一个音控的智能厨房应用程序
译者 | 布加迪审校 | 重楼这篇指南逐步介绍了创建一个自动化的厨房助理的过程,附有语音命令、实时购物清单管理以及食谱建议。 我在本教程中将介绍创建一个智能厨房应用程序(Chent),它可以根据个性化偏好简化杂货清单管理。 该应用程序通过语音命令操作,简化了人机交互和添加商品。
12/24/2024 8:12:59 AM
布加迪
市场份额稳居前三!商汤智算服务持续领跑
国际权威咨询机构IDC近日发布《中国智算服务市场(2024上半年)跟踪》报告。 报告显示,2024年上半年,商汤科技作为国内领先的智算服务商,以13.3%的市场份额稳居GenAI IaaS市场Top3,位列GenAI IaaS领域第一梯队。 Gen AI驱动,商汤站稳智算市场头部阵营2024上半年中国智算服务整体市场同比增长79.6%,市场规模达到146.1亿元人民币。
12/23/2024 5:22:00 PM
新闻助手
ABCoder 在大模型编程领域的探索
前言大语言模型(以下简称大模型或 LLM) 真正意义上火出圈,应该算是 OpenAI 发布 ChatGPT 后(22 年底)。 从这个时间开始,到现在为止,已经过了很长一段时间了,市面上也出现了一些编程工具,比如 MarsCode、Copilot 或者 Cursor 等比较火的结合 IDE 的插件和工具。 而实际上:经过了这么长时间的 LLM 产品发展,大家的编程方式真的被改变了吗?
12/23/2024 4:02:39 PM
高文举
扒一扒o3-mini背后团队:3位华人核心成员,北大清华南开校友在列
比o1 mini性能更强,价格更低,性价比新王o3-mini再次引爆AI圈热议。 在官方截图中,中等o3-mini的性能和o1 mini差不多,价格却只有后者的一半,整体延迟也和GPT-4o相当。 最主要的,这表明了OpenAI可以在降低成本的同时提高性能。
12/23/2024 3:00:00 PM
量子位
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
英伟达
Anthropic
代码
训练
算法
Stable Diffusion
芯片
蛋白质
开发者
LLM
腾讯
生成式
Claude
苹果
AI新词
Agent
神经网络
AI for Science
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
GPU
AI设计
百度
华为
工具
大语言模型
搜索
具身智能
场景
RAG
字节跳动
大型语言模型
深度学习
预测
伟达
视觉
Transformer
视频生成
AGI
架构
神器推荐
亚马逊
Copilot
DeepMind
应用
安全