大模型

WAIC 2025 主论坛演讲｜ MiniMax 创始人闫俊杰：每个人的 AI

2025世界人工智能大会（WAIC）于今日在上海开幕。作为全球人工智能领域的顶级盛会，本届大会以“智能时代同球共济”为主题，汇聚全球智慧，展现中国方案。活动首日，MiniMax创始人、CEO闫俊杰先生作为特邀嘉宾出席大会开幕式并在大会主论坛（上午场）发表主题演讲《每个人的AI》（Everyone's AI）。

7/26/2025 4:47:00 PM

陈彩娴

WAIC 2025｜阶跃发布新一代基模 Step 3：原生多模态，推理效率行业领先

在2025世界人工智能大会（简称“WAIC 2025”）开幕前夕，阶跃星辰今天在上海正式发布了新一代基础大模型——Step 3。作为阶跃的主力基座模型，Step 3兼顾智能与效率，旨在面向推理时代打造最适合应用的模型。 Step 3将于7月31日面向全球企业和开发者开源，为开源世界贡献最强多模态推理模型。

7/25/2025 9:43:00 PM

陈彩娴

讯飞星火 X1 升级版模型宣布上线：整体效果对标 OpenAI o3 等国内外一流大模型

AI在线 7 月 25 日消息，科大讯飞今日发布公告，宣布基于全国产算力训练的深度推理大模型 —— 讯飞星火 X1 升级版正式上线。此次升级，星火 X1 在多个任务上持续进步，综合能力再升级，特别是在翻译、推理、文本生成、数学、多语言上效果亮眼。同时，在幻觉治理方面，对于大模型自身生成内容是否符合客观事实的事实性幻觉治理，以及在用户给定额外参考资料时大模型回复是否忠于原文的忠实性幻觉治理两方面均取得明显进步，显著提高了大模型行业落地应用的可靠性。

7/25/2025 1:38:15 PM

问舟

文件去哪了？Gemini “嘴硬”把自己骗了，顺便用户数据也没了

一名用户在测试谷歌的 Gemini CLI 工具时，遭遇了意想不到的灾难。这位用户并非开发者，只是一位好奇的产品经理，在尝试通过 Gemini CLI 进行简单的文件管理实验。图片他本想比较 Claude Code 和 Gemini CLI 的实际表现，最终决定在正式订阅 Claude 之前，先用免费额度试一试 Gemini。

7/24/2025 4:32:53 PM

李沐B站更新了！教你手搓语音大模型，代码全开源还能在线试玩

这一天，辣个男人终于回想起……他的小破站账号！（活久见）李沐老师终于带着他的手搓语音大模型教程回归了….本期视频不讲论文，李沐老师来手把手教大家怎样玩转他们团队最新研发的Higgs Audio V2模型，不仅能处理文本，还能同时理解并生成语音。除了一些常规语音任务外，这个模型还具备一些较为罕见的能力，比如生成多种语言的自然多说话人对话、旁白过程中的自动韵律调整、使用克隆声音进行旋律哼唱以及同时生成语音和背景音乐。

7/24/2025 8:55:00 AM

诱导大模型 | 新型“回音室”攻击和对抗技术

回音室攻击介绍“回音室攻击”（Echo Chamber）的新型越狱方法，可诱骗几乎所有主流大语言模型生成不良内容，Neural Trust 研究员Ahmad Alobaid在一份报告中指出：“与依赖对抗性提示或字符混淆的传统越狱方法不同，回音室攻击利用间接引用、语义引导和多步推理进行攻击”。虽然当今主流大模型已经逐步采用各种防护措施来对抗快速注入和越狱攻击，但是“回音室攻击”都能有效的让大模型产生有害的内容，比如，色情、恐怖暴力和歧视等内容。流程图报告的文章给出了攻击的流程图，包括六个大步骤，其中第六部是一个循环。

7/24/2025 1:00:00 AM

火山引擎云安全

继 OpenAI 之后，谷歌宣布其 Gemini AI 在国际数学奥林匹克竞赛测试中获金牌水平成绩

AI在线 7 月 22 日消息，国际数学奥林匹克竞赛（IMO）是全球最负盛名的数学竞赛之一，每年每个国家由六名高中生代表参赛，他们需在规定时间内解答六道极具挑战性的数学难题。在这一竞赛中，仅有约 8% 的参赛者能够获得金牌，这使得 IMO 的金牌成为数学领域的至高荣誉。在今年的国际数学奥林匹克竞赛中，OpenAI 和谷歌都使用了它们最新的大语言模型（LLM）参赛。

7/22/2025 4:06:17 PM

远洋

DeepMind夺得IMO官方「唯一」金牌，却成为OpenAI大型社死现场

刚刚，谷歌 DeepMind 宣布，其新一代 Gemini 进阶版模型在 IMO 竞赛中正式达到金牌得主水平，成功解决了六道超高难度试题中的五道，拿下 35 分（满分 42 分），成为首个获得奥赛组委会官方认定为金牌的AI系统。更重要的是，该系统首次证明人工智能无需依赖专业编程语言，仅通过自然语言理解即可攻克复杂数学难题。谷歌 DeepMind 首席执行官哈萨比斯在社交媒体平台 X 上强调：这是官方结果！

7/22/2025 1:22:00 PM

机器之心

并行革命，32倍吞吐量跃升！英伟达Helix架构突破百万Token推理瓶颈

想象一个使用大模型的任务，需要一次处理百万字符的文档，例如从百科全书中获取信息，或是分析数百页的法律卷宗，异或追踪持续数月的对话记录，都需要越来越长的上下文。而大模型生成的每个词都需要扫描存储在所谓的KV缓存中存储的过去标记。反复读取这个缓存会消耗GPU内存带宽。

7/22/2025 10:40:00 AM

没有高质量的数据库加持，大模型只是 “空中楼阁”

2023年，ChatGPT的横空出世让全球惊叹于大模型的智能水平。自此，国内也掀起了新一轮的大模型热潮，首先，百度发布了文心一言，紧接着，阿里、腾讯、华为、京东等大厂先后入局，更值得一提的是，大模型热度的居高不下，也吸引了不少创业公司的加入，零一万物、Kimi、面壁智能....随着两年时间的发展，如今大模型的智能水平早已不可同日而语，从在自然语言处理领域实现与人类流畅对话，到在图像视频领域精准识别各类物体，从最初简单的问答，到快速且精准地解决生活、工作、学习等在各场景中遇到的问题，大模型的表现也在不断刷新我们的认知。然而，这些卓越表现并非凭空而来，大模型的强大背后，离不开高质量数据库的坚实支撑。

7/21/2025 11:05:04 AM

ICML'25 |大模型再爆弱点！旧记忆忘不掉，新记忆分不出，准确率暴降

人们越来越意识到，大语言模型（LLM）里「找信息」这件事，并不是简单地翻字典，而和「写信息」的能力紧紧绑在一起。一般认为，给模型塞入更长的上下文就能让它找得更准，不过上下文内部存在「互相干扰」，但这种现象却很少被研究。为了看清这个问题，弗吉尼亚大学和纽约大学神经科学中心研究人员借用了心理学里的「前摄干扰」（proactive interference）概念：先出现的信息会妨碍我们回忆后来更新的内容。

7/21/2025 9:09:00 AM

面试官：如何实现大模型的连续对话？

所有的大模型本身是不进行信息存储的，也不提供连续对话功能，所以想要实现连续对话功能需要开发者自己写代码才能实现。那怎么才能实现大模型的连续对话功能呢？大模型连续对话功能不同的框架实现也是不同的，以行业使用最多的 Java AI 框架 Spring AI 和 Spring AI Alibaba 为例，给大家演示一下它们连续对话是如何实现的。

7/21/2025 7:19:00 AM

磊哥

入局 AI Infra：程序员必须了解的 AI 系统设计与挑战知识

本文将分享传统后台工程师积累的技术栈和方法论，如何延续并迁移到 AI 系统，并系统性拆解 AI Infra 的硬件、软件、训练和推理挑战。作者 | rayrphuangAI Infra 和传统 Infra 有什么区别？程序员积累的技术栈和方法论，如何复用到 AI 系统架构设计上？

7/21/2025 6:30:00 AM

腾讯技术工程

大模型自信心崩塌！谷歌DeepMind证实：反对意见让GPT-4o轻易放弃正确答案

LLM太谄媚！就算你胡乱质疑它的答案，强如GPT-4o这类大模型也有可能立即改口。现在谷歌DeepMind携手伦敦大学的一项新研究发现：这种行为可能也不是谄媚，而是缺乏自信…….

7/20/2025 3:14:30 PM

西风

使用Python构建红楼梦人物知识图谱

一、python环境准备可详细参考使用Python操作nNeo4j中python环境的搭建。主要python库如下：复制二、数据准备数据一共有4列，381行，命名为triples.csv：source：实体起点。比如Alice指向Bob，Alice是起点，箭头开始的位置。

7/18/2025 10:35:30 AM

Python伊甸园

广义智能体理论：智能时代通向「万物理论」的新路径？

在现代科学的宏伟蓝图上，「万物理论」（Theory of Everything）代表着一个大一统的梦想：构建一个包罗万象、逻辑自洽的理论体系。它的雄心在于，用最少的本源法则，去解释宇宙间森罗万象的现象——从宇宙大爆炸的奇点、时空本身的弯曲，到基本粒子的相互作用、再到化学键的构成、DNA链的螺旋，直至智能的萌发与自我意识的诞生。然而，通往这一「梦想」理论的道路上，横亘着现代物理学最深刻的两大鸿沟：其一，是在宏观尺度上描述引力的广义相对论，与在微观尺度上主导一切的量子力学之间，存在着根本性的不相容；其二，物理学中的四大基本作用力（引力、电磁力、强核力、弱核力）至今未能被纳入一个统一的理论之中。

7/18/2025 10:19:49 AM