上海 AI 实验室书生・浦语大模型升级：仅用 4T 数据训练而成，通用模型首次融合常规对话与深度思考

作者：清源 2025-01-15 03:03

IT之家从上海人工智能实验室获悉，其书生大模型今日获得重要版本升级——书生·浦语3.0（InternLM3）。据官方介绍，其通过精炼数据框架大幅提升了数据效率，实现思维密度的跃升。

AI在线从上海人工智能实验室获悉，其书生大模型今日获得重要版本升级 —— 书生・浦语 3.0（InternLM3）。据官方介绍，其通过精炼数据框架大幅提升了数据效率，实现思维密度的跃升。

InternLM3-8B-Instruct 仅使用 4T 数据训练，官方宣称其综合性能超过同量级开源模型，节约超 75% 训练成本；首次在通用模型中实现了常规对话与深度思考能力融合，可应对更多真实使用场景。

基于司南 OpenCompass 开源评测框架，该模型研究团队使用统一可复现的方法对该模型进行评测。评测采用 CMMLU、GPQA 等十多个权威评测集，维度包括推理、数学、编程、指令跟随、长文本、对话及综合表现等多方面性能，结果显示，书生・浦语 3.0 在大多数评测集得分领先，综合性能“十分接近 GPT-4o-mini”。

上海 AI 实验室书生・浦语大模型升级：仅用 4T 数据训练而成，通用模型首次融合常规对话与深度思考

上海 AI 实验室披露了部分该模型的体验案例，如解答“箭头迷宫问题”等推理谜题，让模型在棋盘格中找到从起点到终点的可行路径。

上海 AI 实验室书生・浦语大模型升级：仅用 4T 数据训练而成，通用模型首次融合常规对话与深度思考

以及“猜数字”问题：

上海 AI 实验室书生・浦语大模型升级：仅用 4T 数据训练而成，通用模型首次融合常规对话与深度思考

此外，其深度思考能力也拓展到了智能体任务，成为了开源社区内首个支持浏览器使用的通用对话模型，支持 20 步以上网页跳转以完成深度信息挖掘。

体验页面：https://internlm-chat.intern-ai.org.cn
GitHub链接：https://github.com/InternLM/InternLM
HuggingFace链接：https://huggingface.co/internlm
ModelScope链接：https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm3-8b-instruct

中文大语言模型赶考：商汤与上海AI Lab等新发布「书生·浦语」

今天，一年一度的高考正式拉开帷幕。

6/7/2023 2:48:00 PM

机器之心

基于LLaMA却改张量名，李开复公司大模型开源行为引争议，官方回应来了

机器之心报道机器之心编辑部有研究者发现，李开复「零一万物」公司的 Yi-34B 模型基本上采用了 LLaMA 的架构，只是重命名了两个张量。对此，「零一万物」给出了官方回应。前段时间，开源大模型领域迎来了一个新的模型 —— 上下文窗口大小突破 200k，能一次处理 40 万汉字的「Yi」。这个大模型由创新工场董事长兼 CE0 李开复创立的大模型公司「零一万物」构建，包括了 Yi-6B 和 Yi-34B 两个版本。根据 Hugging Face 英文开源社区平台和 C-Eval 中文评测榜单，Yi-34B 推出时取得

11/14/2023 5:15:00 PM

机器之心

做大模型时代的最佳云底座，百度智能云打出三套「组合拳」

不破不立，重构云计算这件事，百度智能云公布了最新进展。

12/21/2023 2:57:00 PM

机器之心

上海 AI 实验室书生・浦语大模型升级：仅用 4T 数据训练而成，通用模型首次融合常规对话与深度思考

相关资讯

中文大语言模型赶考：商汤与上海AI Lab等新发布「书生·浦语」

基于LLaMA却改张量名，李开复公司大模型开源行为引争议，官方回应来了

做大模型时代的最佳云底座，百度智能云打出三套「组合拳」