AIGC宇宙 AIGC宇宙

文章列表

大模型越反思越错,原来是长链推理通过自我说服加重幻觉 | 北邮

来自北京邮电大学的研究团队通过思维链审计实验,首次定量揭示了这一“越想越错”现象背后的元认知偏差:长链推理中的反思不是纠错机制,而是给幻觉颁发“理性证书”——模型为保持与用户提示语义一致,宁可篡改协议定义也不否定前提。 风险缺口:长链CoT放大“误差滚雪球”推理大模型(RLLMs)能把复杂问题拆解成几十步推理,再给出看似缜密的结论。 然而,随着推理链条变长,一个令人不安的趋势浮出水面——错误不再是偶发失误,而是沿链条滚雪球式放大。
7/4/2025 8:42:00 AM

刚刚,Ilya官宣出任SSI CEO!送走「叛徒」联创,豪言不缺GPU

小扎到处挖人的举动,不仅是惹恼了奥特曼,连Ilya都忍无可忍,被炸出来了! 就在刚刚,消失许久的Ilya忽然现身X。 他发文表示,自己已亲自挂帅「安全超级智能」(SSI)的CEO。
7/4/2025 8:33:30 AM
新智元

Sam Altman的“温和奇点”已至:我们真的越过了AI的“事件视界”吗?

近日,OpenAI 的掌舵人 Sam Altman 在其个人博客上发表了一篇题为《The Gentle Singularity》(温和的奇点, )的重磅文章,再次将人工智能的未来推向了舆论的风口浪尖。 Altman 以其一贯的前瞻性视角,大胆宣称:“我们已越过事件视界;起飞已经开始。 人类已接近构建数字超级智能,而且至少到目前为止,它远没有看起来那么怪异。
7/4/2025 8:25:03 AM
白明的赞赏账户

如何用DeepSeek做数据分析?这套方法超神!

同学们,Deepseek用起来没有! 经过半年磨合,陈老师是发现这玩意越用越好用。 今天把使用心得分享给大家。
7/4/2025 7:51:40 AM
接地气的陈老师

他做的AI视频刷爆全网!专访AI.Talk赵汗青

前两天,一个 AI 的虚拟 IP 火了,刷爆了整个 AI 圈。 这个 AI IP,叫 YURI,出自我心中一直封神的 AI 频道:AI.TALK。 当视频在手机上无法加载,可前往PC查看。
7/4/2025 2:41:37 AM
数字生命卡兹克

趋势抢先知!2025年6月值得关注的10条AI资讯

2025年6月份的AI重大资讯,看这篇就够了! 往期回顾:. 趋势抢先知!
7/4/2025 12:44:00 AM
百度MEUX 团队

OpenAI 奥尔特曼批评 Meta“挖角”行动:有使命感的人会笑到最后

他强调:“有使命感的人终究会胜过只看薪酬的人。”同时指出,OpenAI 正在评估整个研究团队的薪酬结构。
7/3/2025 7:18:54 PM
清源

消息称微软虽掌握 OpenAI 知识产权,但缺乏充分利用该技术的专业知识

微软虽拥有OpenAI知识产权独家使用权,却被曝缺乏技术落地能力,双方合作条款或面临重新谈判。知情人士称微软甚至不知该问什么技术问题,而Meta等竞争对手正以高薪挖角OpenAI核心团队。#科技巨头博弈# #AI人才争夺战#
7/3/2025 6:33:33 PM
远洋

​ChatGPT 助力新闻网站流量增长,但难以弥补搜索流量下滑

根据数字市场智能公司 Similarweb 的最新报告,来自 ChatGPT 对新闻出版商的流量推荐正在逐步增长,但这一增长尚不足以抵消用户通过 AI 或 AI 驱动的搜索结果直接获取新闻所导致的点击下降。 自2024年5月谷歌推出 AI 概览以来,网络新闻搜索中没有点击新闻网站的比例从56% 上升至近69%。 这意味着,越来越多的用户在搜索新闻时并未点击任何链接,直接通过 AI 获得信息。
7/3/2025 6:00:47 PM
AI在线

从封闭到放开:百度开源文心 4.5 全家桶,多项基准上领先 Deepseek,行业天花板再抬高

百度突然宣布,将旗下最新的大语言模型文心大模型4.5(ERNIE 4.5)全系列开源,震动整个AI行业。 此次开源采用Apache 2.0许可协议,意味着全球开发者不仅可以免费下载和使用,也可以自由修改与商用。 图片这标志着百度战略方向的重大转变。
7/3/2025 4:27:26 PM

新闻出版业危机:ChatGPT 引荐流量增长难抵 AI 搜索冲击

Similarweb报告显示,AI驱动的搜索结果导致新闻网站自然流量大幅下滑,2024年5月至2025年5月未转化为点击的搜索比例从56%升至69%。尽管ChatGPT对新闻网站的引荐流量增长25倍,但仍难弥补整体损失。#AI冲击新闻业# #ChatGPT#
7/3/2025 3:59:50 PM
远洋

从播客到带娃,看老黄、纳德拉、奥特曼这些CEO 如何在生活中使用 AI

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)在大多数人还在摸索 AI 能帮自己做什么时,那些全球最忙、最顶尖的大公司 CEO,更是乐在AI中,更为恐怖地是,这些大佬可不是为了炫技,而是纯纯的刚需。 他们用 AI 跟播客“对话”、用 AI 总结邮件、甚至在深夜带娃时,也离不开 ChatGPT。 本文带你看看,微软、OpenAI、苹果、英伟达、Zillow 这五位 CEO,分别是怎么在日常生活中「高频使用 AI」的。
7/3/2025 3:40:27 PM
云昭

Gemini负责人爆料!多模态统一token表示,视觉至关重要

一水 闻乐 发自 凹非寺. 量子位 | 公众号 QbitAI一次性揭秘Gemini多模态技术! 就在刚刚,Gemini模型行为产品负责人Ani Baddepudi在谷歌自家的开发者频道开启了爆料模式。
7/3/2025 3:06:44 PM
闻乐

差点被Ilya摁掉,胎死腹中!ChatGPT爆红内幕首次公开

自2022年11月30日上线以来,ChatGPT迅速爆红。 连OpenAI自己都没料到会这么火。 在OpenAI播客第二期中,ChatGPT负责人Nick Turley和首席研究官Mark Chen首度揭秘这款产品的幕后故事。
7/3/2025 3:00:00 PM
新智元

DeepSeek-R2!?神秘模型惊现竞技场,真实身份引网友猜测

DeepSeek-R2,终于要来了? 大模型竞技场秘密上线了一个叫steve的神秘模型,在对话中透露自己来自DeepSeek。 不过,网友们并不满足于知道steve的厂商,开始讨论起了steve的具体身份。
7/3/2025 2:57:51 PM

DeepSeek-R2!?神秘模型惊现竞技场,真实身份引网友猜测

克雷西 发自 凹非寺. 量子位 | 公众号 QbitAIDeepSeek-R2,终于要来了? 大模型竞技场秘密上线了一个叫steve的神秘模型,在对话中透露自己来自DeepSeek。
7/3/2025 2:56:50 PM
克雷西

ChatGPT诞生内幕大曝光!发布前一晚还在纠结

ChatGPT诞生内幕最新大曝光:. 纳尼? ?
7/3/2025 12:48:50 PM
鹭羽

探秘 LLM 强化学习兼容性:上海交大揭示 Llama 与 Qwen 差异,推出 OctoThinker

大型语言模型(LLM)通过结合任务提示和大规模强化学习(RL)在复杂推理任务中取得了显著进展,如 Deepseek-R1-Zero 等模型直接将强化学习应用于基础模型,展现出强大的推理能力。 然而,这种成功在不同的基础模型系列中难以复制,尤其是在 Llama 系列上。 这引发了一个核心问题:究竟是什么因素导致了不同基础模型在强化学习过程中表现不一致?强化学习在 Llama 模型上的扩展限制OpenAI 的 o1、o3和 DeepSeek 的 R1等模型在竞赛级数学问题上通过大规模强化学习取得了突破,推动了对千亿参数以下小型模型强化学习能力的探索。
7/3/2025 12:00:57 PM
AI在线