小而强，英伟达剪枝、蒸馏出 Llama-3.1-Minitron 4B AI 模型

作者：故渊 2024-08-17 07:21

英伟达公司联合 Meta 公司发布了最新的 Llama-3.1-Minitron 4B AI 模型，主要通过结构化权重剪枝、知识提炼等尖端技术，成功蒸馏（Distill）出 40 亿参数的“小而强”模型。图源：英伟达Llama-3.1-Minitron 4B 模型在 Llama-3.1-Minitron 8B 基础上蒸馏而来，英伟达在深度和宽度方向上使用了结构化剪枝技术。AI在线注：剪枝是一种删除网络中不那么重要的层或神经元的技术，保留其性能的情况下，目的是减小模型的大小和复杂度。英伟达通过从模型中删除 16 层来

英伟达公司联合 Meta 公司发布了最新的 Llama-3.1-Minitron 4B AI 模型，主要通过结构化权重剪枝、知识提炼等尖端技术，成功蒸馏（Distill）出 40 亿参数的“小而强”模型。

图源：英伟达

Llama-3.1-Minitron 4B 模型在 Llama-3.1-Minitron 8B 基础上蒸馏而来，英伟达在深度和宽度方向上使用了结构化剪枝技术。

AI在线注：剪枝是一种删除网络中不那么重要的层或神经元的技术，保留其性能的情况下，目的是减小模型的大小和复杂度。

英伟达通过从模型中删除 16 层来进行深度剪枝，并将其从 8B 模型缩减为 4B 模型，此外还部署另一种技术，通过修剪嵌入维度和 MLP 中间层来进行宽度剪枝。

除了剪枝，Nvidia 还采用了经典蒸馏技术来提高 Llama-3.1-Minitron 4B 的效率。

知识蒸馏是一个过程，在这个过程中，一个较小的模型（即学生）会被训练成模仿一个更大、更复杂的模型（即教师）的行为。通过这种方式，较小模型中保留了原始模型的大部分预测能力，但速度更快，资源更节省。

小而强，英伟达剪枝、蒸馏出 Llama-3.1-Minitron 4B AI 模型

英伟达将此与蒸馏技术和剪枝技术相结合，确保重新训练的 4B 模型性能优异，并在更大的模型中得到很好的应用。

OpenAI重大发现：GPT-4b micro改造诺奖研究，山中因子重编程效率提高50倍

AI 加速科学和药物研发，已经不是什么新鲜事，但它的潜力远未被完全释放。就在刚刚过去的一天，OpenAI 宣布他们与生物科技初创公司 Retro Bio 合作，研发的新模型 GPT-4b micro，设计出了新型且显著增强的山中因子变体。山中因子是一组蛋白质，由诺奖得主、日本科学家山中伸弥在 2006 年提出，其包括 Oct4、Sox2、Klf4 和 c - Myc4 种因子，又称 OSKM。

8/23/2025 7:28:00 PM

机器之心

硅基流动:下线部分未备案模型，用户请注意迁移

近日，硅基流动在其更新公告中宣布，为了进一步优化资源配置，提供更先进、优质、合规的技术服务，将于2025年3月6日对部分模型进行下线处理。此次下线的模型主要为未经审查的国外模型，特别是生图模型，仅保留KColor。请用户注意，如果之前接入了公告中提及的模型，务必在3月6日前完成迁移。

3/5/2025 10:00:25 AM

AI在线

Meta 发布 Llama 4 系列 AI 模型，引入“混合专家架构”提升效率

Meta推出Llama 4系列AI模型，含Scout、Maverick和尚在训练的Behemoth。已上架Scout和Maverick，性能各有亮点。#Meta #Llama4系列AI模型#

4/6/2025 5:34:53 AM

漾仔

小而强，英伟达剪枝、蒸馏出 Llama-3.1-Minitron 4B AI 模型

相关资讯

OpenAI重大发现：GPT-4b micro改造诺奖研究，山中因子重编程效率提高50倍

硅基流动:下线部分未备案模型，用户请注意迁移

Meta 发布 Llama 4 系列 AI 模型，引入“混合专家架构”提升效率