LN

英伟达新开源模型 Llama-Nemotron 震撼发布，推理性能超越 DeepSeek-R1

近日，英伟达正式推出了其最新开源模型系列 ——Llama-Nemotron，该系列模型不仅在推能力上超越了 DeepSeek-R1，更是在内存效率和吞吐量上实现了显著提升。根据最新发布的技术报告，Llama-Nemotron 的训练过程与众不同，采用了合成数据监督微调与强化学习的方法，以全方位提升模型的推理能力。 Llama-Nemotron 系列模型包括 LN-Nano8B、LN-Super49B 和 LN-Ultra253B。

5/7/2025 10:01:04 AM

AI在线

归一化提高预训练、缓解梯度不匹配，Facebook的模型超越GPT-3

来自 Facebook AI 的研究者提出了 NormFormer，该模型能够更快地达到目标预训练的困惑度，更好地实现预训练困惑度和下游任务性能。

10/27/2021 4:53:00 PM

机器之心

资讯热榜

印度创新试点：AI 聊天机器人助力电子商务购物新方式两部门联合发布《政务领域人工智能大模型部署应用指引》大力推动AI技术应用软银贷款50亿美元助力AI投资，孙正义押注未来科技！马斯克 xAI 在孟菲斯开建全球最大污水处理厂，年节约饮用水达 190 亿升前DeepMind大神创业一年估值飙至80亿美元：Reflection AI要做美国版DeepSeek OpenAI新研究称GPT-5为迄今“政治偏见最少”的AI模型 Sora2公布提示词指南！直接抄作业能玩一整天！ OpenAI Sora 引爆 App Store“山寨潮”:30万次下载!苹果审核机制遭质疑

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画机器人数据大模型 Midjourney 开源 Meta 智能微软用户 AI新词 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练论文代码 LLM 算法 Stable Diffusion 芯片腾讯 AI for Science 苹果 Agent Claude 蛋白质开发者生成式神经网络 xAI 机器学习 3D 研究人形机器人生成 AI视频百度工具 RAG 大语言模型 Sora 华为 GPU 计算具身智能 AI设计字节跳动搜索大型语言模型 AGI 场景深度学习视频生成架构预测视觉伟达 DeepMind Transformer 编程神器推荐 AI模型亚马逊 MCP