大模型

他一人撑起谷歌90%的AI宣传，劈柴真是挖到鬼才了

西风发自凹非寺. 量子位 | 公众号 QbitAI一个人撑起了谷歌AI宣传90%的工作！而且这人还是被谷歌从OpenAI挖来的，谁啊？

7/10/2025 4:57:12 PM

西风

揭开大模型的秘密！那些 “思考词” 背后藏着惊人的信息量

近日，来自中国人民大学、上海人工智能实验室、伦敦大学学院和大连理工大学的研究团队揭示了大模型推理过程中的一个重要发现:当模型在思考时，所使用的 “思考词” 实际上反映了其内部信息量的显著提升。这一研究成果通过信息论的方法，为我们更好地理解人工智能的推理机制提供了新的视角。论文地址：，会输出一些看似人类化的语言，比如 “嗯……”、“让我想想……” 或 “因此……”。

7/5/2025 7:46:41 AM

AI在线

Meta-Think ≠ 记套路，多智能体强化学习解锁大模型元思考泛化

本文第一作者为上海交通大学计算机科学四年级博士生万梓煜，主要研究方向为强化学习、基础模型的复杂推理，通讯作者为上海交通大学人工智能学院温颖副教授和上海人工智能实验室胡舒悦老师。团队其他成员包括来自英属哥伦比亚大学的共同第一作者李云想、Mark Schmidt 教授，伦敦大学学院的宋研、杨林易和汪军教授，上海交通大学的温潇雨，王翰竟和张伟楠教授。引言最近，关于大模型推理的测试时间扩展（Test time scaling law ）的探索不断涌现出新的范式，包括① 结构化搜索结（如 MCTS），② 过程奖励模型（Process Reward Model ） PPO，③ 可验证奖励（Verifiable Reward） GRPO（DeepSeek R1）。

7/4/2025 8:53:00 AM

华为多路径推理破解大模型数学瓶颈，准确率超97%｜ICML 2025

大模型越来越大，通用能力越来越强，但一遇到数学、科学、逻辑这类复杂问题，还是常“翻车”。为破解这一痛点，华为诺亚方舟实验室提出全新高阶推理框架 ——思维森林（Forest-of-Thought，FoT）。该方法借鉴人类“多角度思考、反复验证”的认知方式，打破传统LLM的线性推理范式，通过构建多棵并行推理树，引入动态自我修正机制与多视角共识决策策略。

7/4/2025 8:53:00 AM

重磅发现！大模型的「aha moment」不是装腔作势，内部信息量暴增数倍！

刘勇，中国人民大学，长聘副教授，博士生导师，国家级高层次青年人才。长期从事机器学习基础理论研究，共发表论文 100 余篇，其中以第一作者/通讯作者发表顶级期刊和会议论文近 50 篇，涵盖机器学习领域顶级期刊 JMLR、IEEE TPAMI、Artificial Intelligence 和顶级会议 ICML、NeurIPS 等。你肯定见过大模型在解题时「装模作样」地输出：「Hmm…」、「Wait, let me think」、「Therefore…」这些看似「人类化」的思考词。

7/4/2025 8:47:00 AM

大模型越反思越错，原来是长链推理通过自我说服加重幻觉 | 北邮

来自北京邮电大学的研究团队通过思维链审计实验，首次定量揭示了这一“越想越错”现象背后的元认知偏差：长链推理中的反思不是纠错机制，而是给幻觉颁发“理性证书”——模型为保持与用户提示语义一致，宁可篡改协议定义也不否定前提。风险缺口：长链CoT放大“误差滚雪球”推理大模型（RLLMs）能把复杂问题拆解成几十步推理，再给出看似缜密的结论。然而，随着推理链条变长，一个令人不安的趋势浮出水面——错误不再是偶发失误，而是沿链条滚雪球式放大。

7/4/2025 8:42:00 AM

Gemini负责人爆料！多模态统一token表示，视觉至关重要

一水闻乐发自凹非寺. 量子位 | 公众号 QbitAI一次性揭秘Gemini多模态技术！就在刚刚，Gemini模型行为产品负责人Ani Baddepudi在谷歌自家的开发者频道开启了爆料模式。

7/3/2025 3:06:44 PM

闻乐

探秘 LLM 强化学习兼容性:上海交大揭示 Llama 与 Qwen 差异，推出 OctoThinker

大型语言模型（LLM）通过结合任务提示和大规模强化学习(RL)在复杂推理任务中取得了显著进展，如 Deepseek-R1-Zero 等模型直接将强化学习应用于基础模型，展现出强大的推理能力。然而，这种成功在不同的基础模型系列中难以复制，尤其是在 Llama 系列上。这引发了一个核心问题:究竟是什么因素导致了不同基础模型在强化学习过程中表现不一致?强化学习在 Llama 模型上的扩展限制OpenAI 的 o1、o3和 DeepSeek 的 R1等模型在竞赛级数学问题上通过大规模强化学习取得了突破，推动了对千亿参数以下小型模型强化学习能力的探索。

7/3/2025 12:00:57 PM

AI在线

一文详解Character AI：实用指南+ ChatGPT、Gemini对比分析

译者 | 晶颜审校 | 重楼本指南将深入剖析Character AI的运行机制、功能特性及其存在的局限性。近年来，生成式人工智能领域发展态势迅猛，其应用范畴已远超单纯的文本生成领域。在众多备受瞩目的新兴平台中，Character AI是一款支持用户以对话形式与人工智能生成角色进行交互的工具。

7/3/2025 8:03:54 AM

晶颜

大模型时代，通用视觉模型将何去何从？

过去几年，通用视觉模型（Vision Generalist Model，简称 VGM）曾是计算机视觉领域的研究热点。它们试图构建统一的架构，能够处理图像、点云、视频等多种视觉模态输入，以及分类、检测、分割等多样的下游任务，向着「视觉模型大一统」的目标迈进。然而，随着大语言模型 LLM 的迅猛发展，研究热点已经悄然发生转移。

7/2/2025 9:17:13 AM

o3通关「俄罗斯方块」，碾压Gemini夺冠！UCSD新基准击碎宝可梦

谁能想到，作为童年回忆的宝可梦，现在竟摇身一变，成了大模型的试金石！在无数人的童年记忆中，《宝可梦》是一款意义非凡的游戏——简单的操作哪怕是年纪尚小的孩子也能轻松上手。然而，要真正通关这款游戏，仍然需要缜密的规划和大量的时间投入。

7/2/2025 2:45:00 AM

新智元

AI实战案例：快速实现快递查询助手！

昨晚直播，咱们用 RAG（Retrieval-Augmented Generation，检索增强生成）实现了数据库 AI 助手，今天我们准备换一个技术使用 function call 来实现快递 AI 助手。执行效果快递 AI 助手的业务逻辑很清晰，就是我通过 LLM 大语言模型的对话来查询我的快递详情，例如，我问 AI 我有几个“运送中”的快递，他把这些快递查询并展示出来，效果如下图所示：什么是 function call？定义： Function Call（也称为 Tool Call）它允许大模型与一组 API 或工具进行交互，从而增强其功能。

7/2/2025 12:00:00 AM

谷歌“送 AI 进校园”新举措：推出师生专享 Gemini 教育项目

年满 18 岁的学生还可以使用“Gemini Canvas”，依据任意主题生成个性化测验题，辅助复习。谷歌表示，未来数周内将逐步拓展至更年轻的学生群体。

6/30/2025 10:13:07 PM

清源

OpenAI：智谱在海外市场取得了显著进展，是大模型领域的新锐代表

OpenAI最新博文盛赞智谱AI在东南亚、中东和非洲市场的显著进展，称其为国产AI“四小龙”之一。智谱AI凭借自主开发模型和定价优势，在海外市场抢占先机。#国产AI出海# #大模型竞争#

6/30/2025 6:48:13 PM

潞源（实习）

百度重磅开源文心大模型 4.5 系列，国内大模型市场再掀波澜！

近日，百度正式宣布开源其文心大模型4.5系列，共推出了十款模型，包括47B、3B 激活参数的混合专家（MoE）模型，以及0.3B 参数的稠密型模型。此次开源不仅实现了预训练权重的完整公开，还提供了推理代码，标志着百度在大模型领域的重大进展。这些新发布的模型可以在飞桨星河社区、Hugging Face 等平台上下载和部署，同时，百度智能云千帆大模型平台也提供了相应的 API 服务。

6/30/2025 3:00:50 PM

AI在线

Gemini定时任务上线！一句话解锁AI自动干活，效率起飞

近日，谷歌Gemini推出全新功能“Scheduled Actions”（定时任务），允许用户通过简单的提示词设定未来或定期任务。这一功能的发布标志着Gemini向更智能、更主动的数字助理角色迈出了重要一步。 AIbase整理了最新网络信息，为您深度解析这一功能如何重塑生产力工具的未来。

6/30/2025 3:00:50 PM

AI在线

重磅发布！全球首个千亿级发电行业大模型 “擎源” 震撼登场！

6月30日，由国家能源集团自主研发的全球首个千亿级发电行业大模型 “擎源” 正式发布。这一创新性的大模型以其独特的全栈自主可控特性，标志着发电行业向智能决策的新时代迈出了重要一步。 “擎源” 大模型旨在结合发电产业的多样场景、高复杂度以及强专业性，充分利用国家能源集团在全球最大的装机规模及海量数据资源。

6/30/2025 10:01:00 AM

AI在线

我国首个发电行业大模型“擎源”发布，模型参数达千亿级别

据央视新闻报道，记者今天从国家能源集团获悉，我国首个发电行业专业大模型 ——“擎源”在北京发布，模型参数达千亿级别，这也是全球首个千亿级发电行业大模型，有效提升了模型的推理能力，为发电行业实现安全、高效、绿色、智慧发电提供“超级大脑”。

6/28/2025 7:16:05 PM

浩渺

资讯热榜

腾讯云大模型升级公告:DeepSeek-V3/ DeepSeek-R1模型将于24日正式下线 OpenAI低调更新GPT4o模型，多项能力反超DeepSeek DeepSeek-R1 登顶 Hugging Face：以10000 赞力压 150 万个模型自有歪果仁为DeepSeek「辩经」：揭穿围绕DeepSeek的谣言 IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线东风日产N7首款接入DeepSeek大模型，实现智能化人机交互腾讯云上线DeepSeek全系API接口并打通联网搜索微信搜索接入DeepSeek大模型称AI不会使用朋友圈聊天等信息

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习技术智能体 Gemini 马斯克 Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型研究百度 Sora 生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 特斯拉场景 AI模型深度学习亚马逊架构 Transformer MCP 编程视觉预测