AIGC宇宙 AIGC宇宙

大模型

谷歌Chrome浏览器迎来AI革命,Gemini 让你的上网体验更智能

近日,谷歌宣布将在其 Chrome 浏览器中深度整合自研的人工智能模型 Gemini,标志着其在 AI 搜索领域的重大进步。 这一新功能面向全美的 Mac、Windows 及移动设备用户,将为他们带来更为便捷与智能的上网体验。 Gemini 不仅可以应用户请求解释当前访问的网页内容,还能整合多个标签页的信息,甚至帮助用户恢复之前关闭的网站。
9/19/2025 9:56:50 AM
AI在线

当大模型“思考”时,它在做什么?—解构 LLM 架构体系

Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建大模型应用架构技术底座:LLM 架构体系。 在人工智能技术快速演进的时代背景下,大语言模型(Large Language Models, LLMs)作为自然语言处理领域的核心架构,正逐步重塑人机交互的技术范式。 从智能对话系统到内容生成平台,从复杂决策支持到跨语言信息处理,LLM 已成为现代人工智能基础设施中不可或缺的组成部分。
9/19/2025 9:46:53 AM
Luga Lee

历史性突破!中国AI首登《自然》封面,DeepSeek重新定义大模型标准

一个明显的趋势是,中国在AI基础研究领域正在从"跟跑者"悄然转变为"领跑者"。 而这一转变的标志性事件,就是昨天DeepSeek-R1研究论文登上《自然》封面这件事。 说实话,当我看到这个消息的时候,第一反应是有点震撼。
9/19/2025 9:13:43 AM
阿丸笔记

刚刚,OpenAI在ICPC 2025编程赛上满分登顶,Gemini也达到金牌水平

IMO 之后,OpenAI 与 Gemini 双双加冕 ICPC 2025 金牌。 就在刚刚,OpenAI 和 Gemini 都声称达到了 ICPC 金牌水平。 其中,OpenAI 在 5 个小时内解决了所有 12 个问题,相当于人类排名第 1 位,超过了所有参赛大学团队。
9/18/2025 1:22:00 PM
机器之心

OpenAI 回归机器人:想把大模型推向物理世界

在暂停数年后,OpenAI 正将研究与招聘资源重新投向“具身智能”,并把焦点进一步推向人形系统。 多份权威报道、公开招聘信息与产业动向交叉印证:这家以大模型闻名的公司,正在搭建一个面向现实世界的机器人研发矩阵。 图片WIRED 9 月 15 日的报道,OpenAI 近来密集招募具有人形机器人与物理控制算法背景的科研人才,并在训练路径上强调遥操作(teleoperation)与仿真(包括 Nvidia Isaac 等工具);公司是否自建硬件或与外部制造商合作仍未明朗,但“人形形态”的研究正在加速推进。
9/17/2025 6:03:37 PM

突破单链思考上限,清华团队提出原生「并行思考」scale范式

近年来,大语言模型(LLMs)在复杂推理任务上的能力突飞猛进,这在很大程度上得益于深度思考的策略,即通过增加测试时(test-time)的计算量,让模型生成更长的思维链(Chain-of-Thought)。 然而,这条路径正面临着一个明显的瓶颈:随着计算资源的持续投入,性能提升变得微乎其微,甚至陷入停滞。 来自清华大学 AIR 的一篇最新研究论文《ParaThinker: Native Parallel Thinking as a New Paradigm to Scale LLM Test-time Compute》对这一瓶颈发起了挑战 。
9/17/2025 9:27:37 AM

谷歌最强AI不是Nano Banana?真正的王炸竟然是它!

你以为 Nano Banana 就是谷歌 AI 最强模型? 那你就大错特错了! 诚然,Nano Banana 能够将多张图像融合为一张、在复杂叙事中保持角色一致、通过自然语言指令进行精确转换,还能利用 Gemini 的知识库生成和编辑图像。
9/17/2025 2:03:35 AM
龙爪槐守望者

谷歌 AI 承包商裁员风波:200 多名员工因工作条件争议被解雇

谷歌近期对外包公司 GlobalLogic 的承包商进行了裁员,超过200名员工因工薪和工作条件问题被解雇。 这一行动引发了员工的不满和抗议,他们指出长期以来的低薪与恶劣的工作环境,导致这一冲突不断升级。 这些被裁的承包商主要负责谷歌的 AI 产品的评估和改进工作,包括新推出的 Gemini 聊天机器人及其 AI 概述功能。
9/16/2025 10:06:32 AM
AI在线

历史性逆转!谷歌Gemini终结ChatGPT霸榜神话,登顶美区iOS免费榜

谷歌旗下的AI助手Gemini在美国iOS平台实现历史性突破,下载量首次超越长期霸榜的ChatGPT,成功登顶免费应用下载榜首位。 这一里程碑式的成就打破了ChatGPT在AI应用领域的长期垄断地位。 据业内分析,Gemini此次爆发式增长的核心驱动力来自其最新集成的NanoBanana图像生成模型。
9/15/2025 5:21:15 PM
AI在线

上海加速医疗器械领域 AI 技术应用,助力高端产业全链条发展

人工智能开源生态正在经历一场前所未有的变革洗礼。 蚂蚁集团在外滩大会上重磅发布的大模型开源开发全景与趋势2.0版本,如同一面镜子,清晰映射出这个快速演进领域的真实面貌。 这份全景图的诞生并非简单的数据堆砌,而是通过严谨的OpenRank评价体系精心筛选的结果。
9/15/2025 5:21:14 PM
AI在线

人格陷阱:AI如何假装人类

译者 | 核子可乐审校 | 重楼最近有个趣闻:一位女士在邮局排队时跟工作人员争执起来,原因是ChatGPT说邮政网站上公布了“保价承诺”,但实际上这只是AI的幻觉。 而相较于信任面前的邮政人员,这位女士显然更相信AI的建议——AI在她眼中不只是文本生成器,更像是“带来神谕的使者”。 也就是说,很多人对于AI聊天机器人存在着根本性误解。
9/15/2025 8:00:57 AM
核子可乐

微软加码自研大模型:不把鸡蛋放在OpenAI一个篮子里

近日,微软(MSFT.US)宣布一项重大战略举措 —— 豪掷重金扩大物理基础设施,加码自研 AI 模型开发。 这一动作引发行业广泛关注,毕竟微软长期以来深度依赖 OpenAI 的大型语言模型支撑自身产品生态。 为何微软选择在与 OpenAI 保持合作的同时,大力推进自研大模型?
9/15/2025 1:00:00 AM
小菲

AI解数学题只靠最后一个token

henry 发自 凹非寺. 量子位 | 公众号 QbitAI大语言模型在解心算题时,只依赖最后一个token? 最近,来自加州大学圣克鲁兹分校、乔治·梅森大学和Datadog的研究人员发现:在心算任务中,几乎所有实际的数学计算都集中在序列的最后一个token上完成,而不是分散在所有token中。
9/14/2025 1:37:10 PM
henry

迎战软件3.0时代:新范式、新挑战、新工程

我们正处在一个技术范式剧烈变革的黎明。 从企业信息化的流程固化,到互联网时代的数据驱动,软件的形态和价值在不断演进。 如今,以大语言模型(LLM)为代表的生成式人工智能技术,正以前所未有的力量,将我们推向一个全新的纪元——Software 3.0(软件3.0),一个由“意图”驱动的智能化时代。
9/12/2025 4:23:12 PM
肖然

聚焦结构化注意力,探索提升多模态大模型文档问答性能

本文聚焦多模态大语言模型(MLLMs)在文档问答(DocQA)任务中的性能提升,提出无需改动模型架构或额外训练的结构化输入方法,通过保留文档层次结构与空间关系(如标题、表格、图像位置)优化理解能力。 研究发现,传统无结构OCR输入导致注意力分散,性能下降,而 LaTeX 范式结构化输入显著提升表现。 注意力分析揭示其诱导“结构化注意力”,减少无关区域干扰,聚焦语义核心。
9/11/2025 1:23:28 PM
互联网算法团队

为什么 LangChain ReAct 机制值得关注 ?

在当前由大型语言模型(LLM)驱动的应用开发浪潮中,如何赋予模型超越文本生成、具备可靠推理与行动的能力,已成为衡量其智能水平的关键分野。 正是在这一背景下,Langchain 框架中的 ReAct(Reasoning and Acting)机制应运而生,并迅速成为业界瞩目的焦点。 ReAct 不仅仅是一种技术实现,更是一种富有远见的智能代理(Agent)设计哲学。
9/11/2025 10:01:45 AM
Luga Lee

Gemini加密交易所IPO价格大幅上调,目标估值超30亿美元!

近日,由著名加密货币大亨文克莱沃斯兄弟创办的加密交易所 Gemini 宣布,计划大幅提高其美国首次公开募股(IPO)的拟议价格区间。 这一举动不仅反映了投资者对加密行业日益增长的兴趣,也显示出 Gemini 在市场中的信心。 根据最新的消息,Gemini 现计划通过出售 1667 万股股票,筹集约 4.333 亿美元。
9/10/2025 9:36:32 AM
AI在线

OpenAI最新研究揭秘大模型为什么会有幻觉!

引言:语言模型的“幻觉”难题在人工智能飞速发展的今天,大语言模型(LLMs)如ChatGPT、DeepSeek等已经成为我们日常生活与工作的得力助手。 然而,这些模型有时会“信口开河”,生成看似合理却完全错误的回答,这种现象被学界称为“幻觉”(hallucination)。 例如,当被问及“亚当·卡莱的生日是哪天?
9/10/2025 4:00:00 AM
机智流科技