大模型

谷歌Chrome浏览器迎来AI革命，Gemini 让你的上网体验更智能

近日，谷歌宣布将在其 Chrome 浏览器中深度整合自研的人工智能模型 Gemini，标志着其在 AI 搜索领域的重大进步。这一新功能面向全美的 Mac、Windows 及移动设备用户，将为他们带来更为便捷与智能的上网体验。 Gemini 不仅可以应用户请求解释当前访问的网页内容，还能整合多个标签页的信息，甚至帮助用户恢复之前关闭的网站。

9/19/2025 9:56:50 AM

AI在线

当大模型“思考”时，它在做什么？—解构 LLM 架构体系

Hello folks，我是 Luga，今天我们来聊一下人工智能应用场景 - 构建大模型应用架构技术底座：LLM 架构体系。在人工智能技术快速演进的时代背景下，大语言模型（Large Language Models, LLMs）作为自然语言处理领域的核心架构，正逐步重塑人机交互的技术范式。从智能对话系统到内容生成平台，从复杂决策支持到跨语言信息处理，LLM 已成为现代人工智能基础设施中不可或缺的组成部分。

9/19/2025 9:46:53 AM

Luga Lee

历史性突破！中国AI首登《自然》封面，DeepSeek重新定义大模型标准

一个明显的趋势是，中国在AI基础研究领域正在从"跟跑者"悄然转变为"领跑者"。而这一转变的标志性事件，就是昨天DeepSeek-R1研究论文登上《自然》封面这件事。说实话，当我看到这个消息的时候，第一反应是有点震撼。

9/19/2025 9:13:43 AM

阿丸笔记

刚刚，OpenAI在ICPC 2025编程赛上满分登顶，Gemini也达到金牌水平

IMO 之后，OpenAI 与 Gemini 双双加冕 ICPC 2025 金牌。就在刚刚，OpenAI 和 Gemini 都声称达到了 ICPC 金牌水平。其中，OpenAI 在 5 个小时内解决了所有 12 个问题，相当于人类排名第 1 位，超过了所有参赛大学团队。

9/18/2025 1:22:00 PM

机器之心

OpenAI 回归机器人：想把大模型推向物理世界

在暂停数年后，OpenAI 正将研究与招聘资源重新投向“具身智能”，并把焦点进一步推向人形系统。多份权威报道、公开招聘信息与产业动向交叉印证：这家以大模型闻名的公司，正在搭建一个面向现实世界的机器人研发矩阵。图片WIRED 9 月 15 日的报道，OpenAI 近来密集招募具有人形机器人与物理控制算法背景的科研人才，并在训练路径上强调遥操作（teleoperation）与仿真（包括 Nvidia Isaac 等工具）；公司是否自建硬件或与外部制造商合作仍未明朗，但“人形形态”的研究正在加速推进。

9/17/2025 6:03:37 PM

突破单链思考上限，清华团队提出原生「并行思考」scale范式

近年来，大语言模型（LLMs）在复杂推理任务上的能力突飞猛进，这在很大程度上得益于深度思考的策略，即通过增加测试时（test-time）的计算量，让模型生成更长的思维链（Chain-of-Thought）。然而，这条路径正面临着一个明显的瓶颈：随着计算资源的持续投入，性能提升变得微乎其微，甚至陷入停滞。来自清华大学 AIR 的一篇最新研究论文《ParaThinker: Native Parallel Thinking as a New Paradigm to Scale LLM Test-time Compute》对这一瓶颈发起了挑战。

9/17/2025 9:27:37 AM

谷歌最强AI不是Nano Banana？真正的王炸竟然是它！

你以为 Nano Banana 就是谷歌 AI 最强模型？那你就大错特错了！诚然，Nano Banana 能够将多张图像融合为一张、在复杂叙事中保持角色一致、通过自然语言指令进行精确转换，还能利用 Gemini 的知识库生成和编辑图像。

9/17/2025 2:03:35 AM

龙爪槐守望者

谷歌 AI 承包商裁员风波：200 多名员工因工作条件争议被解雇

谷歌近期对外包公司 GlobalLogic 的承包商进行了裁员，超过200名员工因工薪和工作条件问题被解雇。这一行动引发了员工的不满和抗议，他们指出长期以来的低薪与恶劣的工作环境，导致这一冲突不断升级。这些被裁的承包商主要负责谷歌的 AI 产品的评估和改进工作，包括新推出的 Gemini 聊天机器人及其 AI 概述功能。

9/16/2025 10:06:32 AM

AI在线

历史性逆转!谷歌Gemini终结ChatGPT霸榜神话，登顶美区iOS免费榜

谷歌旗下的AI助手Gemini在美国iOS平台实现历史性突破，下载量首次超越长期霸榜的ChatGPT，成功登顶免费应用下载榜首位。这一里程碑式的成就打破了ChatGPT在AI应用领域的长期垄断地位。据业内分析，Gemini此次爆发式增长的核心驱动力来自其最新集成的NanoBanana图像生成模型。

9/15/2025 5:21:15 PM

AI在线

上海加速医疗器械领域 AI 技术应用，助力高端产业全链条发展

人工智能开源生态正在经历一场前所未有的变革洗礼。蚂蚁集团在外滩大会上重磅发布的大模型开源开发全景与趋势2.0版本，如同一面镜子，清晰映射出这个快速演进领域的真实面貌。这份全景图的诞生并非简单的数据堆砌，而是通过严谨的OpenRank评价体系精心筛选的结果。

9/15/2025 5:21:14 PM

AI在线

人格陷阱：AI如何假装人类

译者 | 核子可乐审校 | 重楼最近有个趣闻：一位女士在邮局排队时跟工作人员争执起来，原因是ChatGPT说邮政网站上公布了“保价承诺”，但实际上这只是AI的幻觉。而相较于信任面前的邮政人员，这位女士显然更相信AI的建议——AI在她眼中不只是文本生成器，更像是“带来神谕的使者”。也就是说，很多人对于AI聊天机器人存在着根本性误解。

9/15/2025 8:00:57 AM

核子可乐

微软加码自研大模型：不把鸡蛋放在OpenAI一个篮子里

近日，微软（MSFT.US）宣布一项重大战略举措 —— 豪掷重金扩大物理基础设施，加码自研 AI 模型开发。这一动作引发行业广泛关注，毕竟微软长期以来深度依赖 OpenAI 的大型语言模型支撑自身产品生态。为何微软选择在与 OpenAI 保持合作的同时，大力推进自研大模型？

9/15/2025 1:00:00 AM

小菲

AI解数学题只靠最后一个token

henry 发自凹非寺. 量子位 | 公众号 QbitAI大语言模型在解心算题时，只依赖最后一个token？最近，来自加州大学圣克鲁兹分校、乔治·梅森大学和Datadog的研究人员发现：在心算任务中，几乎所有实际的数学计算都集中在序列的最后一个token上完成，而不是分散在所有token中。

9/14/2025 1:37:10 PM

henry

迎战软件3.0时代：新范式、新挑战、新工程

我们正处在一个技术范式剧烈变革的黎明。从企业信息化的流程固化，到互联网时代的数据驱动，软件的形态和价值在不断演进。如今，以大语言模型（LLM）为代表的生成式人工智能技术，正以前所未有的力量，将我们推向一个全新的纪元——Software 3.0（软件3.0），一个由“意图”驱动的智能化时代。

9/12/2025 4:23:12 PM

肖然

聚焦结构化注意力，探索提升多模态大模型文档问答性能

本文聚焦多模态大语言模型（MLLMs）在文档问答（DocQA）任务中的性能提升，提出无需改动模型架构或额外训练的结构化输入方法，通过保留文档层次结构与空间关系（如标题、表格、图像位置）优化理解能力。研究发现，传统无结构OCR输入导致注意力分散，性能下降，而 LaTeX 范式结构化输入显著提升表现。注意力分析揭示其诱导“结构化注意力”，减少无关区域干扰，聚焦语义核心。

9/11/2025 1:23:28 PM

互联网算法团队

为什么 LangChain ReAct 机制值得关注？

在当前由大型语言模型（LLM）驱动的应用开发浪潮中，如何赋予模型超越文本生成、具备可靠推理与行动的能力，已成为衡量其智能水平的关键分野。正是在这一背景下，Langchain 框架中的 ReAct（Reasoning and Acting）机制应运而生，并迅速成为业界瞩目的焦点。 ReAct 不仅仅是一种技术实现，更是一种富有远见的智能代理（Agent）设计哲学。

9/11/2025 10:01:45 AM

Luga Lee

Gemini加密交易所IPO价格大幅上调，目标估值超30亿美元！

近日，由著名加密货币大亨文克莱沃斯兄弟创办的加密交易所 Gemini 宣布，计划大幅提高其美国首次公开募股（IPO）的拟议价格区间。这一举动不仅反映了投资者对加密行业日益增长的兴趣，也显示出 Gemini 在市场中的信心。根据最新的消息，Gemini 现计划通过出售 1667 万股股票，筹集约 4.333 亿美元。

9/10/2025 9:36:32 AM

AI在线

OpenAI最新研究揭秘大模型为什么会有幻觉！

引言：语言模型的“幻觉”难题在人工智能飞速发展的今天，大语言模型（LLMs）如ChatGPT、DeepSeek等已经成为我们日常生活与工作的得力助手。然而，这些模型有时会“信口开河”，生成看似合理却完全错误的回答，这种现象被学界称为“幻觉”（hallucination）。例如，当被问及“亚当·卡莱的生日是哪天？

9/10/2025 4:00:00 AM

机智流科技

资讯热榜

马斯克 xAI 在孟菲斯开建全球最大污水处理厂，年节约饮用水达 190 亿升 2025 全球十大工程成就揭晓：DeepSeek入选大的来了：谷歌Gemini 3.0 Pro单次生成网页版操作系统，Win、Mac、Linux一网打尽日本政府对 OpenAI Sora 2 发布版权警告，要求遵守法律规定 OpenAI官宣自研首颗芯片，AI界「M1时刻」九个月杀到！联手博通三年10GW 马来西亚迎来 AI 新纪元，ChatGPT Go 助力数字化转型 OpenAI 与 Sur Energy 签署协议:25亿美元阿根廷数据中心项目启动 OpenAI与博通达成战略合作，推动AI算力革命

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画机器人数据大模型 Midjourney 开源 Meta 智能微软用户 AI新词 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练论文 LLM 代码算法芯片 Stable Diffusion 苹果腾讯 AI for Science Claude Agent 蛋白质开发者生成式神经网络 xAI 机器学习 3D 研究人形机器人生成 AI视频百度工具具身智能 Sora RAG 大语言模型 GPU 华为计算字节跳动 AI设计搜索大型语言模型 AGI 场景深度学习视频生成架构 DeepMind 预测视觉伟达 Transformer 编程 AI模型神器推荐亚马逊 MCP

大模型

谷歌Chrome浏览器迎来AI革命，Gemini 让你的上网体验更智能

当大模型“思考”时，它在做什么？—解构 LLM 架构体系

历史性突破！中国AI首登《自然》封面，DeepSeek重新定义大模型标准

刚刚，OpenAI在ICPC 2025编程赛上满分登顶，Gemini也达到金牌水平

OpenAI 回归机器人：想把大模型推向物理世界

突破单链思考上限，清华团队提出原生「并行思考」scale范式

谷歌最强AI不是Nano Banana？真正的王炸竟然是它！

谷歌 AI 承包商裁员风波：200 多名员工因工作条件争议被解雇

历史性逆转!谷歌Gemini终结ChatGPT霸榜神话，登顶美区iOS免费榜

上海加速医疗器械领域 AI 技术应用，助力高端产业全链条发展

人格陷阱：AI如何假装人类

微软加码自研大模型：不把鸡蛋放在OpenAI一个篮子里

AI解数学题只靠最后一个token

迎战软件3.0时代：新范式、新挑战、新工程

聚焦结构化注意力，探索提升多模态大模型文档问答性能

为什么 LangChain ReAct 机制值得关注 ？

Gemini加密交易所IPO价格大幅上调，目标估值超30亿美元！

OpenAI最新研究揭秘大模型为什么会有幻觉！

为什么 LangChain ReAct 机制值得关注？