大模型

上海 AI 实验室书生・浦语大模型升级：仅用 4T 数据训练而成，通用模型首次融合常规对话与深度思考

IT之家从上海人工智能实验室获悉，其书生大模型今日获得重要版本升级——书生·浦语3.0（InternLM3）。据官方介绍，其通过精炼数据框架大幅提升了数据效率，实现思维密度的跃升。

1/15/2025 3:03:47 PM

清源

字节跳动2024奖学金公布：清华北大等八院校15名博士获奖

1月14日，字节跳动公众号公布“第四届字节跳动奖学金”评选结果，来自北京大学、北京邮电大学、清华大学、香港大学、香港城市大学、新加坡管理大学、新加坡国立大学、浙江大学（按拼音首字母排序）的15名在校生获奖，每人获得奖学金10万元人民币。字节跳动奖学金计划是字节跳动于2021年发起的一年一期的人才培养项目。过去三届，共有32位优秀学子获得了奖学金支持。

1/15/2025 3:01:00 PM

新闻助手

2025，大厂们的「大模型牌桌」战

随着大模型六小虎在AGI上的后撤第一枪被正式打响，中国大模型行业的分水岭快速露出水面、更加清晰。初创公司在下一代超大规模模型竞争中的局限性开始被广泛关注，大厂「不下桌」的资本筹码变得更加明显。无论是百度宣布2025年将推出下一代基座模型，还是阿里、字节在AI人才和资金上的继续投入，潮水退去，大模型在决胜战场的主导权还是来到了大厂手中。

1/14/2025 2:52:00 PM

陈彩娴

思维链？思维树？华为诺亚：现在到了思维森林时刻！

OpenAI 接连发布 o1 和 o3 模型，大模型的高阶推理能力正在迎来爆发式增强。在预训练 Scaling law “撞墙” 的背景下，探寻新的 Scaling law 成为业界关注的热点。高阶推理能力有望开启新的 Scaling law，为大模型的发展注入新的活力。

1/14/2025 1:52:56 PM

国产推理大模型决战2025考研数学，看看谁第一个上岸？

随着上个月 2025 研究生考试的结束，最新的考研数学真题成为大语言模型尤其是推理模型的「试炼场」，将考验它们的深度思考能力。业内曾有着这样一种共识：大语言模型在文字水平上的表现令人印象深刻，但说到数学就不甚令人满意了。去年一度火出圈的「9.9 与 9.11」比大小的问题，包括 GPT-4o 在内的很多大模型都翻车了，直到深度推理模型出现后才从根本上改善了这一状况。

1/14/2025 1:51:18 PM

Anthropic新研究：用统计思维评估大模型

目前，评估大模型的方法就是比在基准测试中的数值，在于突出SOTA结果，并未充分考虑统计显著性。例如，在对不同模型进行评估时，若仅依据表面的得分高低判断优劣，而不考虑数据的不确定性和变异性，可能会得出不准确的结论。所以，Anthropic提出了将严谨的统计思维引入大模型评估领域。

1/10/2025 10:30:00 AM

AIGC开放社区

我们一起聊聊如何给AI大模型喂数据？

大家好呀，我是飞鱼。如果我想要大模型学习我的知识，怎么给他数据呢？数据是大模型的食物，只有喂对了，模型才能更好地学习和成长。

1/10/2025 8:06:39 AM

日常加油站

有把握收入从1亿做到数亿！李开复最新回应25年调整：大厂才烧得起超大模型；第一年的打法已不再适用，AI应用爆发前夜公司要提前卡位

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）在零一万物深陷“收购风波”时，李开复第一时间在朋友圈进行了澄清。与此同时，他一口气接受了多个采访，通过披露更多信息来攻破谣言。图片关于零一万物预训练团队和Infra团队的去向已经明晰：愿意继续训练超大参数模型的成员，可以加入零一和阿里云合作成立的“产业大模型联合实验室”。

1/9/2025 1:47:30 PM

伊风

讯飞商业生态平台2.0来了！构建大模型应用服务新体系

AI时代的聚光灯已经由“模型参数”转移到“应用价值”，引领千行百业发掘大模型刚需场景，构建新质生产力。据智能超参数发布的《中国大模型中标项目监测报告(2024)》显示，2024年有披露的大模型中标项目达到1520个，相比去年增长了15.5倍。 1月8日，科大讯飞AI服务市场行业伙伴生态大会在北京中关村国际会议中心成功举办。

1/9/2025 12:15:00 PM

新闻助手

金山云全面升级智算服务体系开启AI 2.0时代云计算发展新纪元

随着大模型落地应用，人工智能发展进入2.0时代。在此阶段，智算云服务加速演进，成为新一代人工智能发展的核心驱动力，展现出无限潜能。知名调研机构IDC发布的《中国智算服务市场（2024上半年）跟踪》报告显示，2024年上半年中国智算服务整体市场同比增长79.6%，市场规模达到146.1亿元人民币。

1/8/2025 11:38:53 AM

Tokenization，再见！Meta提出大概念模型LCM，1B模型干翻70B？

最近，受人类构思交流的高层级思路启发，Meta AI研究员提出全新语言建模新范式「大概念模型」，解耦语言表示与推理。网友Chuby兴奋地表示：「如果Meta的大概念模型真的有用，那么同等或更高效率的模型，其规模将更小。比如说1B模型将堪比70B的Llama 4。

1/8/2025 9:30:00 AM

新智元

0 Token 间间隔 100% GPU 利用率，百度百舸 AIAK 大模型推理引擎极限优化 TPS

什么是大模型推理引擎大模型推理引擎是生成式语言模型运转的发动机，是接受客户输入 prompt 和生成返回 response 的枢纽，也是拉起异构硬件，将物理电能转换为人类知识的变形金刚。大模型推理引擎的基本工作模式可以概括为，接收包括输入 prompt 和采样参数的并发请求，分词并且组装成 batch 输入给引擎，调度 GPU 执行前向推理，处理计算结果并转为词元返回给用户。和人类大脑处理语言的机制类似，大模型首先会把输入的 prompt 进行统一理解，形成具有记忆能力的上下文。

1/8/2025 8:55:32 AM

跨年舞台歌手翻车惨烈，AI唱作俱佳，意外圈粉

AI好好用报道编辑：Sia刚刚过去的跨年舞台，依旧延续了群魔乱舞的台风。假唱早已见怪不怪。假唱。

1/6/2025 6:08:00 PM

AI好好用

全网都在扒的DeepSeek团队，是清北应届生撑起一片天

DeepSeek-v3大模型横空出世，以1/11算力训练出超过Llama 3的开源模型，震撼了整个AI圈。紧接着，“雷军开千万年薪挖DeepSeek研究员罗福莉”的传闻，也使得人们把目光聚焦向DeepSeek的人才。这下不只科技圈，全网都在好奇，连小红书上都有人发帖询问，这究竟是一只怎样的团队？

1/6/2025 7:45:00 AM

OpenAI发布新年目标，Agent智能体或将迎来百模大战

2025年1月1日，OpenAI CEO 奥特曼公布了公司的新年目标，涵盖AGI、智能体、4o升级、模型更好记忆、更长上下文等等。图片关于智能体，有网友爆料，OpenAI 可能在 1 月份发布一个名为 “operator” 的 Agent，这个 Agent 将具备直接控制电脑的能力。图片其实24年10月份的时候，Claude 就已经发布了基于 Claude 3.5 Sonnet 多模态大模型，可操作电脑的智能体。

1/3/2025 11:02:38 AM

渡码

阿里云与零一万物达成战略合作，成立“产业大模型联合实验室” ，加速落地应用

近期，阿里云和大模型头部企业零一万物达成模型平台业务的战略合作，双方将成立“产业大模型联合实验室”，联手加速大模型从技术到应用的落地，进一步扩大产业大模型的生态整合。据悉，双方深度战略合作的产业大模型联合实验室包含技术、业务、人才等板块，阿里和零一万物将结合两个团队全球顶尖的大模型研发实力，形成从下一代基座模型技术探索到产业落地大模型服务的组合拳，全面通过阿里云百炼大模型平台的模型服务层面向市场，针对 ToB 行业打造更强更全面的大模型解决方案，加速大模型穿透千行百业。在开展的合作中，阿里云拥有从技术到算力到服务层的平台级完整链条，通义系列大模型将作为具有强大通用能力的“教师模型”，零一万物拥有国际前沿的高性价比模型能力，能够敏捷批量训练垂直定向的产业智能模型，双方联手将加速大模型的产业落地，拓宽大模型生态前景。

1/3/2025 10:32:00 AM

新闻助手

金融风控领域的大模型落地实践

Akulaku 作为一个海外互联网金融平台，运用大模型优化金融风控、客服及电商推荐等场景，通过集成图像（如 KYC 人脸识别）、文本（如智能客服）与设备数据，增强风控系统效能与用户体验。大模型的引入旨在提升效率，通过优化小模型构建与工作流程自动化，减轻业务人员负担。智能体在金融领域的应用包括欺诈调查与数据分析助手，预示着通过大模型辅助构建类 AGI 系统的可能性，能够进一步提升金融风控的效率与效果，在金融领域拥有广泛的应用前景。

1/3/2025 8:26:17 AM

黄泓

智象未来多模态大模型3.0全球首发，创始人兼CEO梅涛演讲实录来了

2024年12月28日，智象未来科技有限公司在安徽省人工智能产业先导区启动仪式中，宣布智象多模态生成大模型3.0与智象多模态理解大模型1.0同时发布。上海电影集团、中国移动咪咕音乐、科大讯飞等企业参加。加拿大工程院外籍院士、智象未来创始人兼CEO梅涛进行现场演讲。

1/2/2025 4:20:00 PM

新闻助手

资讯热榜

最具争议性研究：大模型中间层输出可 100% 反推原始输入 Wan2.2-Animate又火了！5分钟让抠脚大汉秒变高冷女神奥特曼回应一切：重组后仍需微软支持，不相信OpenAI的欢迎做空 OpenAI 或将于明年上市，估值可达万亿！ OpenAI更新ChatGPT规则：10月29日起禁止医疗、法律与财务建议「套壳」的最高境界：OpenAI揭秘Atlas浏览器架构OWL 亚马逊股价暴涨 13%，人工智能推动云计算迎来多年最快增长 Bevel 获得 1000 万美元 A 轮融资，致力于 AI 健康助手创新

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画大模型机器人数据 Midjourney 开源 Meta AI新词微软智能用户 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练 LLM 论文代码算法 Agent AI for Science 芯片苹果 Claude 腾讯 Stable Diffusion 蛋白质开发者生成式神经网络 xAI 机器学习 3D RAG 人形机器人 AI视频研究大语言模型生成具身智能 Sora 工具 GPU 百度华为计算字节跳动 AI设计大型语言模型 AGI 搜索视频生成场景深度学习架构生成式AI DeepMind 编程视觉 Transformer AI模型预测亚马逊特斯拉 MCP

大模型

上海 AI 实验室书生・浦语大模型升级：仅用 4T 数据训练而成，通用模型首次融合常规对话与深度思考

字节跳动2024奖学金公布：清华北大等八院校15名博士获奖

2025，大厂们的「大模型牌桌」战

思维链？思维树？华为诺亚：现在到了思维森林时刻！

国产推理大模型决战2025考研数学，看看谁第一个上岸？

Anthropic新研究：用统计思维评估大模型

我们一起聊聊如何给AI大模型喂数据？

有把握收入从1亿做到数亿！李开复最新回应25年调整：大厂才烧得起超大模型；第一年的打法已不再适用，AI应用爆发前夜公司要提前卡位

讯飞商业生态平台2.0来了！构建大模型应用服务新体系

金山云全面升级智算服务体系开启AI 2.0时代云计算发展新纪元​

Tokenization，再见！Meta提出大概念模型LCM，1B模型干翻70B？

0 Token 间间隔 100% GPU 利用率，百度百舸 AIAK 大模型推理引擎极限优化 TPS

跨年舞台歌手翻车惨烈，AI唱作俱佳，意外圈粉

全网都在扒的DeepSeek团队，是清北应届生撑起一片天

OpenAI发布新年目标，Agent智能体或将迎来百模大战

阿里云与零一万物达成战略合作，成立“产业大模型联合实验室” ，加速落地应用

金融风控领域的大模型落地实践

智象未来多模态大模型3.0全球首发，创始人兼CEO梅涛演讲实录来了

金山云全面升级智算服务体系开启AI 2.0时代云计算发展新纪元