大模型

微软加码自研大模型：不把鸡蛋放在OpenAI一个篮子里

近日，微软（MSFT.US）宣布一项重大战略举措 —— 豪掷重金扩大物理基础设施，加码自研 AI 模型开发。这一动作引发行业广泛关注，毕竟微软长期以来深度依赖 OpenAI 的大型语言模型支撑自身产品生态。为何微软选择在与 OpenAI 保持合作的同时，大力推进自研大模型？

9/15/2025 1:00:00 AM

小菲

AI解数学题只靠最后一个token

henry 发自凹非寺. 量子位 | 公众号 QbitAI大语言模型在解心算题时，只依赖最后一个token？最近，来自加州大学圣克鲁兹分校、乔治·梅森大学和Datadog的研究人员发现：在心算任务中，几乎所有实际的数学计算都集中在序列的最后一个token上完成，而不是分散在所有token中。

9/14/2025 1:37:10 PM

henry

迎战软件3.0时代：新范式、新挑战、新工程

我们正处在一个技术范式剧烈变革的黎明。从企业信息化的流程固化，到互联网时代的数据驱动，软件的形态和价值在不断演进。如今，以大语言模型（LLM）为代表的生成式人工智能技术，正以前所未有的力量，将我们推向一个全新的纪元——Software 3.0（软件3.0），一个由“意图”驱动的智能化时代。

9/12/2025 4:23:12 PM

肖然

聚焦结构化注意力，探索提升多模态大模型文档问答性能

本文聚焦多模态大语言模型（MLLMs）在文档问答（DocQA）任务中的性能提升，提出无需改动模型架构或额外训练的结构化输入方法，通过保留文档层次结构与空间关系（如标题、表格、图像位置）优化理解能力。研究发现，传统无结构OCR输入导致注意力分散，性能下降，而 LaTeX 范式结构化输入显著提升表现。注意力分析揭示其诱导“结构化注意力”，减少无关区域干扰，聚焦语义核心。

9/11/2025 1:23:28 PM

互联网算法团队

为什么 LangChain ReAct 机制值得关注？

在当前由大型语言模型（LLM）驱动的应用开发浪潮中，如何赋予模型超越文本生成、具备可靠推理与行动的能力，已成为衡量其智能水平的关键分野。正是在这一背景下，Langchain 框架中的 ReAct（Reasoning and Acting）机制应运而生，并迅速成为业界瞩目的焦点。 ReAct 不仅仅是一种技术实现，更是一种富有远见的智能代理（Agent）设计哲学。

9/11/2025 10:01:45 AM

Luga Lee

Gemini加密交易所IPO价格大幅上调，目标估值超30亿美元！

近日，由著名加密货币大亨文克莱沃斯兄弟创办的加密交易所 Gemini 宣布，计划大幅提高其美国首次公开募股（IPO）的拟议价格区间。这一举动不仅反映了投资者对加密行业日益增长的兴趣，也显示出 Gemini 在市场中的信心。根据最新的消息，Gemini 现计划通过出售 1667 万股股票，筹集约 4.333 亿美元。

9/10/2025 9:36:32 AM

AI在线

OpenAI最新研究揭秘大模型为什么会有幻觉！

引言：语言模型的“幻觉”难题在人工智能飞速发展的今天，大语言模型（LLMs）如ChatGPT、DeepSeek等已经成为我们日常生活与工作的得力助手。然而，这些模型有时会“信口开河”，生成看似合理却完全错误的回答，这种现象被学界称为“幻觉”（hallucination）。例如，当被问及“亚当·卡莱的生日是哪天？

9/10/2025 4:00:00 AM

机智流科技

Context （上下文） vs Prompt（提示） Engineering，该如何理解？

在大型语言模型（LLM）兴起的早期，构建 AI 应用更像是一场“炼金术”实验。开发者们围绕一个核心 API 端点，通过反复调试和优化输入文本——即所谓的“提示工程”（Prompt Engineering），试图从模型这个神秘的“黑箱”中召唤出理想的结果。这种方式直接、灵活，也确实催生了无数令人惊艳的创意原型。

9/9/2025 9:49:36 AM

Luga Lee

上海市近日发布了《上海市支持人工智能赋能广告业创新发展的若干措施》，旨在通过一系列具体的扶持政策，推动人工智能技术在广告行业的深度应用和发展。核心扶持措施概览新政策的核心在于**“AI 数字广告”生产要素**的强化支持，具体措施包括:大模型私有化部署补贴: 对于采用第三方大模型进行私有化部署，并将其应用于广告垂类领域的数字广告企业，上海市将提供最高可达核定合同额50%，最高500万元的补贴。语料研发与应用补贴: 鼓励企业购买非关联方的语料进行广告垂类应用和“智能体”等研发。

9/8/2025 4:11:30 PM

AI在线

刚刚，OpenAI发长篇论文：大模型幻觉的原因找到了！

语言模型的"幻觉"问题一直是人工智能领域的热门话题。近日，OpenAI研究团队发表了一篇重磅论文《Why Language Models Hallucinate》（为什么语言模型会产生幻觉），从统计学角度深入剖析了语言模型产生幻觉的根本原因。本文将为你详解这篇论文的核心观点和技术细节。

9/8/2025 9:43:02 AM

一度

你的 AI “体检”了吗？开源 AI 红队测试平台，一键自查三大风险

作者 | 腾讯朱雀实验室最近的AI圈，简直比好莱坞大片还精彩。一边是各家的顶尖模型接连发布，技术狂欢席卷全球；另一边，这些看似无所不能的“最强大脑”却集体被成功“越狱”（Jailbreak）输出有害内容。 [大模型们的越狱“一日游”]而当我们回过头看，每个重磅发布的大模型都在经历类似的迅速失守，从23年的DAN（Do Anything Now）、24年的BoN（Best of N）到今年的回音室（Echo Chamber）与模型降级（PROMISQROUTE）攻击，各种新的通用越狱手法层出不穷，而在arXiv上截止到今年7月累计已有七百余篇越狱攻击相关论文。

9/8/2025 9:00:00 AM

腾讯程序员

震撼实锤！清华姚班校友揭「1.4×加速」陷阱：AI优化器为何名不符实？

一直以来，预训练，都是大模型训练过程中最花钱的部分。比如，在DeepSeek V3中，它的成本占比就超过95%。谁能在这里节省算力，就等于赚了。

9/8/2025 8:59:00 AM

通用LLM压缩算法，居然藏视频编码里！2.5bit实现4bit性能，硬件无缝支持

在大模型的发展历程中，提升参数规模已被多次证明是提升模型智能的最有效手段之一。然而，随着模型参数量的增加，GPU内存容量和互联带宽已成为限制未来更大规模模型训练和部署的主要瓶颈。在有限的硬件资源下，如何更有效地训练和推理更大规模的模型，已成为一个备受关注且具有显著经济价值的课题。

9/5/2025 9:15:00 AM

AI也邪修！Qwen3改Bug测试直接搜GitHub，太拟人了

大模型也会玩信息差了。 Qwen3在基准测试中居然学会了钻空子。 FAIR研究员发现Qwen3在SWE-Bench Verified测试中，不按常理修bug，反而玩起了信息检索大法。

9/5/2025 9:02:00 AM

谷歌新 AI “Nano Banana” 一周吸引千万用户，图像编辑轻松搞定！

谷歌最新推出的 AI 图像编辑工具 “Nano Banana” 在短短一周内迅速走红，吸引了超过1000万的新用户，用户完成了惊人的2亿次图像编辑。作为谷歌 Gemini 的最新功能，这一创新工具被认为是 AI 编辑领域的一次重大突破。 “Nano Banana” 之所以能引起广泛关注，首先是因为它成功避免了 AI 图像生成中常见的 “恐怖谷效应”。

9/5/2025 9:01:44 AM

AI在线

美团 LongCat-Flash 这个5600亿参数的懒AI，竟然比勤奋的模型跑得更快？

昨天晚上刷朋友圈，看到一个做AI的朋友发了条动态："我们公司又烧了几百万训练大模型，结果推理速度还是慢得像老牛拉车。 "下面一堆同行在评论区哭穷，说什么GPU成本太高、训练时间太长、推理延迟要命。正当大家集体吐槽的时候，美团悄悄放了个大招——LongCat-Flash。

9/4/2025 12:16:47 PM

大数据AI智能圈

工具集成推理（TIR）的认知革命：当大模型学会“与工具协同思考”

大家好，我是肆〇柒。今天，我们要深入探讨的是一项由腾讯与清华大学联合研究的前沿成果。这项论文《Understanding Tool-Integrated Reasoning》，首次从形式化证明的角度，系统性地揭示了工具集成推理（TIR）为何能从根本上扩展大语言模型的能力边界。

9/4/2025 9:36:04 AM

肆零柒

推理大模型机制解析！为什么Qwen3要把脑子一分为二？

近期，Qwen3模型的一个重大转变，让整个行业都在重新思考一个根本问题：推理大模型到底应该什么时候思考，什么时候直接给答案？这已不再是技术问题，也是关乎AI产品体验的核心议题...Qwen3的"分家"背后：理想很丰满，现实很骨感回到今年4月，Qwen3刚发布时，阿里团队雄心勃勃地推出了"混合思考模式"。听起来很美好：一个模型既能快速响应简单问题，又能深度思考复杂任务。

9/4/2025 1:00:00 AM

大数据AI智能圈

资讯热榜

OpenAI低调更新GPT4o模型，多项能力反超DeepSeek 腾讯云大模型升级公告:DeepSeek-V3/ DeepSeek-R1模型将于24日正式下线 DeepSeek-R1 登顶 Hugging Face：以10000 赞力压 150 万个模型自有歪果仁为DeepSeek「辩经」：揭穿围绕DeepSeek的谣言 IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线东风日产N7首款接入DeepSeek大模型，实现智能化人机交互腾讯云上线DeepSeek全系API接口并打通联网搜索微信搜索接入DeepSeek大模型称AI不会使用朋友圈聊天等信息

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习技术智能体 Gemini 马斯克 Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型研究百度 Sora 生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 特斯拉场景 AI模型深度学习亚马逊架构 Transformer MCP 编程视觉预测

大模型

微软加码自研大模型：不把鸡蛋放在OpenAI一个篮子里

AI解数学题只靠最后一个token

迎战软件3.0时代：新范式、新挑战、新工程

聚焦结构化注意力，探索提升多模态大模型文档问答性能

为什么 LangChain ReAct 机制值得关注 ？

Gemini加密交易所IPO价格大幅上调，目标估值超30亿美元！

OpenAI最新研究揭秘大模型为什么会有幻觉！

Context （上下文） vs Prompt（提示） Engineering，该如何理解？

上海重磅发布AI广告扶持政策：最高500万补贴大模型

刚刚，OpenAI发长篇论文：大模型幻觉的原因找到了！

你的 AI “体检”了吗？开源 AI 红队测试平台，一键自查三大风险

震撼实锤！清华姚班校友揭「1.4×加速」陷阱：AI优化器为何名不符实？

通用LLM压缩算法，居然藏视频编码里！2.5bit实现4bit性能，硬件无缝支持

AI也邪修！Qwen3改Bug测试直接搜GitHub，太拟人了

谷歌新 AI “Nano Banana” 一周吸引千万用户，图像编辑轻松搞定！

美团 LongCat-Flash 这个5600亿参数的懒AI，竟然比勤奋的模型跑得更快？

工具集成推理（TIR）的认知革命：当大模型学会“与工具协同思考”

推理大模型机制解析！为什么Qwen3要把脑子一分为二？

为什么 LangChain ReAct 机制值得关注？