1B

Meta 推出 Llama 3.2 1B / 3B 模型量化版：功耗更低、可适用更多轻量移动设备

继今年 9 月开源 Llama 3.2 的 1B 与 3B 模型之后，Meta 于 10 月 24 日发布了这两个模型的量化版本，量化后的模型大小平均减少了 56%，RAM 使用量平均减少了 41%，模型速度提高了 2 至 4 倍，同时降低了功耗，使这些模型能够部署到更多移动设备上。 AI在线注：模型量化（Model Quantization）就是通过各种训练方式将浮点模型转为定点模型，可以压缩模型参数，降低模型的复杂性，以便于在更轻量的平台运行。 Meta 表示，他们采用了量化感知训练（Quantization-Aware Training，QAT）和后训练量化（SpinQuant）两种方法对模型进行量化，其中“量化感知训练”更重视模型的准确性，而“后训练量化”更强调模型的可移植性。

10/27/2024 1:53:56 PM

漾仔

资讯热榜

OpenAI 宣布印度用户可享受一年免费 ChatGPT Go 服务 DeepSeek-OCR：OCR 的新突破中小企业AI落地的算力“最优解”：一台插电即用的Mac mini OpenAI 披露：每周有超过一百万人与 ChatGPT 倾诉自杀倾向 LLM近一半回答在扭曲真相！ChatGPT、Gemini，全部顶流模型统统中招！BBC研究：AI系统性错误把媒体拖下水，信任滑坡大模型在具身推理上「翻车」了？4496 道题全面揭示短板作为一个AI博主，我劝你先别急着用AI 红杉资本注资Rogo Technologies，AI 工具或将颠覆初级银行家角色

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画机器人大模型数据 Midjourney 开源 Meta 智能微软用户 AI新词 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练 LLM 论文代码算法 Agent AI for Science 芯片苹果腾讯 Stable Diffusion Claude 蛋白质开发者生成式神经网络 xAI 机器学习 3D RAG 人形机器人研究 AI视频大语言模型生成具身智能 Sora 工具 GPU 百度华为计算字节跳动 AI设计 AGI 大型语言模型搜索视频生成场景深度学习 DeepMind 架构生成式AI 编程视觉 Transformer 预测 AI模型伟达特斯拉亚马逊