AIGC宇宙 AIGC宇宙

理论

一文搞懂 | 大模型为什么出现幻觉?从成因到缓解方案

1、前言随着大模型(Large Language Models, 以下简称LLM)迅猛发展的浪潮中,幻觉(Hallucination)问题逐渐成为业界和学术界关注的焦点。 所谓模型幻觉,指的是模型在生成内容时产生与事实不符、虚构或误导性的信息。 比如,当你询问“世界上最长的河流是哪条?
7/11/2025 9:50:52 AM
火山引擎云安全

多模态大模型的“安全锁”:SAPT 软提示调优技术

引言:多模态大模型的安全困境在人工智能技术飞速发展的当下,多模态大模型(VLM)正以前所未有的速度融入我们的生活,从智能助手到图像识别,从文本生成到跨模态任务处理,它们展现出了令人惊叹的能力。 然而,随着 VLM 在实际应用中的广泛部署,一个不容忽视的问题逐渐浮出水面——其安全性漏洞正成为潜在的“ ticking bomb”。 近期,一篇题为《The Safety Reminder: A Soft Prompt to Reactivate Delayed Safety Awareness in Vision-Language Models》的论文,为我们揭开了 VLM 安全性研究的新篇章。
7/11/2025 1:23:00 AM
果冻布丁兔

科普:AI 是如何理解问题的?它能像人类一样思考吗?

现有的AI推理的局限性在人类的日常生活中,我们并不需要把思维的每一步说出口或画出来才能思考。  比如:你在脑子里可以默默思考一篇文章的结构,或者在脑海中想象一下你家房间的布局。  思考这些都不需要真正动笔或动手去画。
7/10/2025 3:29:10 PM
AI拍档

下一代AI需要「思想微积分」!华人团队重磅揭秘,AI方法论三连发

AI的时代洪流滚滚向前,我们每个人都身处其中,感受着它的光荣与梦想,也承担着它的迷茫与代价。 一方面,是资本市场的狂欢盛宴。 OpenAI的估值冲向千亿美金,英伟达的市值超越众多老牌巨头,任何与「AI」沾边的概念都能轻易点燃投资者的热情。
7/10/2025 2:52:45 PM
新智元

刚刚,Ilya Sutskever宣布自任CEO:联创被Meta挖走了

Meta 的挖掘机,终于挖到了 Ilya 大神的头上。 周五凌晨,OpenAI 联合创始人 Ilya Sutskever(伊尔亚・苏茨克维)久违地在社交媒体发声。 我向我们的团队和投资者发送了以下信息:正如你们所知,Daniel Gross 在我们公司的时间已接近尾声,自 6 月 29 日起,他已正式退出 Safe .
7/4/2025 9:14:10 AM
机器之心

Meta-Think ≠ 记套路,多智能体强化学习解锁大模型元思考泛化

本文第一作者为上海交通大学计算机科学四年级博士生万梓煜,主要研究方向为强化学习、基础模型的复杂推理,通讯作者为上海交通大学人工智能学院温颖副教授和上海人工智能实验室胡舒悦老师。 团队其他成员包括来自英属哥伦比亚大学的共同第一作者李云想、Mark Schmidt 教授,伦敦大学学院的宋研、杨林易和汪军教授,上海交通大学的温潇雨,王翰竟和张伟楠教授。 引言最近,关于大模型推理的测试时间扩展(Test time scaling law )的探索不断涌现出新的范式,包括① 结构化搜索结(如 MCTS),② 过程奖励模型(Process Reward Model ) PPO,③ 可验证奖励 (Verifiable Reward) GRPO(DeepSeek R1)。
7/4/2025 8:53:00 AM

华为多路径推理破解大模型数学瓶颈,准确率超97%|ICML 2025

大模型越来越大,通用能力越来越强,但一遇到数学、科学、逻辑这类复杂问题,还是常“翻车”。 为破解这一痛点,华为诺亚方舟实验室提出全新高阶推理框架 ——思维森林(Forest-of-Thought,FoT)。 该方法借鉴人类“多角度思考、反复验证”的认知方式,打破传统LLM的线性推理范式,通过构建多棵并行推理树,引入动态自我修正机制与多视角共识决策策略。
7/4/2025 8:53:00 AM

重磅发现!大模型的「aha moment」不是装腔作势,内部信息量暴增数倍!

刘勇,中国人民大学,长聘副教授,博士生导师,国家级高层次青年人才。 长期从事机器学习基础理论研究,共发表论文 100 余篇,其中以第一作者/通讯作者发表顶级期刊和会议论文近 50 篇,涵盖机器学习领域顶级期刊 JMLR、IEEE TPAMI、Artificial Intelligence 和顶级会议 ICML、NeurIPS 等。 你肯定见过大模型在解题时「装模作样」地输出:「Hmm…」、「Wait, let me think」、「Therefore…」这些看似「人类化」的思考词。
7/4/2025 8:47:00 AM

大模型越反思越错,原来是长链推理通过自我说服加重幻觉 | 北邮

来自北京邮电大学的研究团队通过思维链审计实验,首次定量揭示了这一“越想越错”现象背后的元认知偏差:长链推理中的反思不是纠错机制,而是给幻觉颁发“理性证书”——模型为保持与用户提示语义一致,宁可篡改协议定义也不否定前提。 风险缺口:长链CoT放大“误差滚雪球”推理大模型(RLLMs)能把复杂问题拆解成几十步推理,再给出看似缜密的结论。 然而,随着推理链条变长,一个令人不安的趋势浮出水面——错误不再是偶发失误,而是沿链条滚雪球式放大。
7/4/2025 8:42:00 AM

刚刚,Ilya官宣出任SSI CEO!送走「叛徒」联创,豪言不缺GPU

小扎到处挖人的举动,不仅是惹恼了奥特曼,连Ilya都忍无可忍,被炸出来了! 就在刚刚,消失许久的Ilya忽然现身X。 他发文表示,自己已亲自挂帅「安全超级智能」(SSI)的CEO。
7/4/2025 8:33:30 AM
新智元

Sam Altman的“温和奇点”已至:我们真的越过了AI的“事件视界”吗?

近日,OpenAI 的掌舵人 Sam Altman 在其个人博客上发表了一篇题为《The Gentle Singularity》(温和的奇点, )的重磅文章,再次将人工智能的未来推向了舆论的风口浪尖。 Altman 以其一贯的前瞻性视角,大胆宣称:“我们已越过事件视界;起飞已经开始。 人类已接近构建数字超级智能,而且至少到目前为止,它远没有看起来那么怪异。
7/4/2025 8:25:03 AM
白明的赞赏账户

如何用DeepSeek做数据分析?这套方法超神!

同学们,Deepseek用起来没有! 经过半年磨合,陈老师是发现这玩意越用越好用。 今天把使用心得分享给大家。
7/4/2025 7:51:40 AM
接地气的陈老师

从封闭到放开:百度开源文心 4.5 全家桶,多项基准上领先 Deepseek,行业天花板再抬高

百度突然宣布,将旗下最新的大语言模型文心大模型4.5(ERNIE 4.5)全系列开源,震动整个AI行业。 此次开源采用Apache 2.0许可协议,意味着全球开发者不仅可以免费下载和使用,也可以自由修改与商用。 图片这标志着百度战略方向的重大转变。
7/3/2025 4:27:26 PM

从播客到带娃,看老黄、纳德拉、奥特曼这些CEO 如何在生活中使用 AI

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)在大多数人还在摸索 AI 能帮自己做什么时,那些全球最忙、最顶尖的大公司 CEO,更是乐在AI中,更为恐怖地是,这些大佬可不是为了炫技,而是纯纯的刚需。 他们用 AI 跟播客“对话”、用 AI 总结邮件、甚至在深夜带娃时,也离不开 ChatGPT。 本文带你看看,微软、OpenAI、苹果、英伟达、Zillow 这五位 CEO,分别是怎么在日常生活中「高频使用 AI」的。
7/3/2025 3:40:27 PM
云昭

差点被Ilya摁掉,胎死腹中!ChatGPT爆红内幕首次公开

自2022年11月30日上线以来,ChatGPT迅速爆红。 连OpenAI自己都没料到会这么火。 在OpenAI播客第二期中,ChatGPT负责人Nick Turley和首席研究官Mark Chen首度揭秘这款产品的幕后故事。
7/3/2025 3:00:00 PM
新智元

DeepSeek-R2!?神秘模型惊现竞技场,真实身份引网友猜测

DeepSeek-R2,终于要来了? 大模型竞技场秘密上线了一个叫steve的神秘模型,在对话中透露自己来自DeepSeek。 不过,网友们并不满足于知道steve的厂商,开始讨论起了steve的具体身份。
7/3/2025 2:57:51 PM

ChatGPT惨败Llama!MIT官宣AI开飞船0%失败率,马斯克火星殖民不再是梦

刚刚,一项最新关于AI「驾驶」宇宙飞船的研究刚发布就火了! 在由Kerbal Space Program衍生的航天挑战赛中,MIT等研究团队让ChatGPT作为「主控」智能体,竟然一举夺得第二名。 这项比赛被视为太空探索自主化的重要实验场,而AI的表现,也预示着「AI开飞船」或许比我们想象的更近!
7/3/2025 9:46:37 AM

刚刚,神秘模型火了!网友:是OpenAI要开源?

刚刚,OpenRouter 上出现了一个神秘模型,该模型被命名为「Cypher Alpha」。 其可以免费使用,100 万 token 上下文,还具有推理能力。 注:OpenRouter 是一个大模型 API 路由器,旨在将各种 AI 模型和服务集成到一个统一的接口中。
7/3/2025 9:31:52 AM