AIGC宇宙 AIGC宇宙

AI

ICML'25 |大模型再爆弱点!旧记忆忘不掉,新记忆分不出,准确率暴降

人们越来越意识到,大语言模型(LLM)里「找信息」这件事,并不是简单地翻字典,而和「写信息」的能力紧紧绑在一起。 一般认为,给模型塞入更长的上下文就能让它找得更准,不过上下文内部存在「互相干扰」,但这种现象却很少被研究。 为了看清这个问题,弗吉尼亚大学和纽约大学神经科学中心研究人员借用了心理学里的「前摄干扰」(proactive interference)概念:先出现的信息会妨碍我们回忆后来更新的内容。
7/21/2025 9:09:00 AM

入局 AI Infra:程序员必须了解的 AI 系统设计与挑战知识

本文将分享传统后台工程师积累的技术栈和方法论,如何延续并迁移到 AI 系统,并系统性拆解 AI Infra 的硬件、软件、训练和推理挑战。 作者 | rayrphuangAI Infra 和传统 Infra 有什么区别? 程序员积累的技术栈和方法论,如何复用到 AI 系统架构设计上?
7/21/2025 6:30:00 AM
腾讯技术工程

最强前端编程渲染:OpenAI o3-alpha 曝光,力压 Sonnet、Grok4 等 AI 顶流模型

AI在线 7 月 19 日消息,科技媒体 bleepingcomputer 昨日(7 月 18 日)发布博文,报道称 OpenAI 正计划升级 o3 推理模型,目前正测试新的 Alpha 版,预估在推理和编程方面会有更大提升。 o3 是 OpenAI 目前最强的推理 AI 模型,而根据最新曝光代码,OpenAI 公司正在开发“o3-alpha-responses-2025-07-17”模型,并以“Anonymous-Chatbot”的名字出现,从名称来看,应该不是 OpenAI 计划发布的开源模型。 该媒体测试了该模式,发现在设计网页方面,在输入相同的简单提示词后,o3-alpha 所创建的内容要优于 o3 模型,甚至有网友已经尝试用 o3-alpha 模型,创建简单的网页游戏。
7/19/2025 8:58:47 AM
故渊

OpenAI深夜发布ChatGPT Agent:能主动思考、自选工具,智能体赛道大变天

今天凌晨1点,OpenAI进行了技术直播发布了重磅产品ChatGPT Agent。 ChatGPT Agent具备自主思考和行动的能力,能够主动从其技能库中选择合适的工具,包括Operator、 Deep Research和ChatGPT来完成各种超复杂任务。 例如,用户可以要求 ChatGPT Agent分析三个竞争对手并制作幻灯片演示文稿等请求。
7/18/2025 10:46:11 AM

广义智能体理论:智能时代通向「万物理论」的新路径?

在现代科学的宏伟蓝图上,「万物理论」(Theory of Everything)代表着一个大一统的梦想:构建一个包罗万象、逻辑自洽的理论体系。 它的雄心在于,用最少的本源法则,去解释宇宙间森罗万象的现象——从宇宙大爆炸的奇点、时空本身的弯曲,到基本粒子的相互作用、再到化学键的构成、DNA链的螺旋,直至智能的萌发与自我意识的诞生。 然而,通往这一「梦想」理论的道路上,横亘着现代物理学最深刻的两大鸿沟:其一,是在宏观尺度上描述引力的广义相对论,与在微观尺度上主导一切的量子力学之间,存在着根本性的不相容;其二,物理学中的四大基本作用力(引力、电磁力、强核力、弱核力)至今未能被纳入一个统一的理论之中。
7/18/2025 10:19:49 AM

大模型转行土木工程!首个「打灰人」评估基准:检验读、改工程图纸能力

在AI竞速的今天,大语言模型(LLM)早已不满足只在象牙塔里「背书解题」。 当GPT-4o刷题通过物理奥赛、DeepSeek熟练搭建网站之后,LLM必须直面一个更现实的问题:这些号称「专家级」的大模型,能不能真的下工地? 能不能帮工程打工人减负?
7/18/2025 10:08:17 AM

刚刚,奥特曼放出ChatGPT「统一智能体」!惊呼真AGI,最卷打工人来了

今晚,ChatGPT和Deep Research、Operator「三剑客」首度合体! 奥特曼亲自带队,25分钟高能直播重磅发布ChatGPT agent,开启人类和智能体协作全新时代。 ChatGPT agent的核心,是一个统一的智能体系统。
7/18/2025 9:59:35 AM

两位AI传奇预测编程的未来,但你想不到

当你刷着技术动态,忽然看到又一条大胆宣称:“AI将在2026年取代所有程序员。 ”这时,OpenAI联合创始人Andrej Karpathy和亚马逊、谷歌资深工程师Steve Yegge给出了他们的真实预测,结果完全颠覆了这种说法。 他们的观点是:大家都想反了。
7/18/2025 9:35:43 AM
前端小智

人类击败OpenAI守住编程冠军!10小时激战两次反超,AI最后关头功亏一篑

10小时激战! 人类最后关头实现超越,获得编程总决赛冠军~而原本始终保持领先优势的OpenAI,最终屈居第二。 在刚刚落幕的AtCoder世界巡回总决赛上,12名决赛选手两天时间里展开角逐。
7/18/2025 9:28:55 AM

Meta 重金抢人,明星云集就能复制 DeepSeek 的成功吗?

最近 AI 圈最大的新闻,大约就是 Meta 扎克伯格亲自出手、重金招人的消息了。 根据公开信息,如今在小扎亲自出手的推动下,Meta 已经组建起一支堪称豪华的 AI 战队。 核心领导团队方面,包括前 Scale AI 创始人 Alexandr Wang(现任 Meta 首席 AI 官)、前 GitHub CEO Nat Friedman,以及 Safe Superintelligence 联合创始人 Daniel Gross,三人共同执掌 Meta Superintelligence Labs 的战略与节奏。
7/17/2025 5:03:00 PM
郑佳美

OpenAI 被曝谋求多元化收入:ChatGPT AI 将整合支付系统,抽佣电商产品

AI在线 7 月 17 日消息,金融时报昨日(7 月 16 日)发布博文,报道称 OpenAI 公司为进一步拓展电商功能并寻求新收入,计划从 ChatGPT 直接销售的在线产品中,抽取一定比例的佣金。 AI在线注:OpenAI 公司目前已经在 ChatGPT 中展示相关商品,并提供链接至在线零售商的选项。 OpenAI 公司今年 4 月,还宣布与支付集团 Shopify 建立合作关系。
7/17/2025 1:47:09 PM
故渊

ChatGPT Plus 新权益:OpenAI 开放 Record 模式,会议记录的高效 AI 解决方案

AI在线 7 月 17 日消息,科技媒体 9to5Mac 昨日(7 月 16 日)发布博文,报道称 OpenAI 面向 ChatGPT Plus 订阅用户,向其开放了在 macOS 版 ChatGPT 应用中,使用 Record Mode 模式的权限。 AI在线注:OpenAI 于 6 月举办的“ChatGPT for business”更新活动中,面向 Team、Enterprise 和 Edu 用户,推出了 Record Mode 模式,在会议和电话会议中实现 AI 辅助记笔记。 在在 ChatGPT 应用中添加了一个小的“录制”按钮,按下后,它开始录制系统音频。
7/17/2025 7:50:14 AM
故渊

OpenAI前员工万字爆料刷屏!Codex发布会前紧急部署、已有63 万PR!工程混乱靠自造轮子;建议创始人去AI大厂当螺丝钉!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)OpenAI 前员工的万字离职帖,在海外技术社区刷屏了! 作者 Calvin French-Owen 把「从初创企业CTO到OpenAI 工程师」的 14 个月,写成了一篇既热血又克制的“内部纪录片”:• 7 周极限冲刺,上线 Codex,上线当天凌晨 4 点还在部署;• 一年扩张几千人,代码库秒变“巨型垃圾场”;• 第一天打开开关,流量就涌进来,“从没见过这么离谱的冷启动”为什么刷屏? 就像作者说得那样:外界关于 OpenAI 的传闻太多,真正从“里面”走出来讲真点一手体验的人太少。
7/16/2025 12:57:50 PM

加拿大丛林迷路五小时,ChatGPT救命神技,比地图还靠谱!

最近,X平台上一个帖子火了,一群人在加拿大偏远的小镇Mabou骑全地形车(ATV)玩,结果迷路了整整五小时,最后靠ChatGPT导航才安全回来。 Mabou是个小地方,周围全是没开发过的森林和小路。 他们本来打算从Upper Southwest Mabou Rd出发,骑18公里到Whycocomagh玩一圈。
7/16/2025 9:58:47 AM

倒反天罡:ChatGPT教人说话?36万视频+77万播客已证实!

AI驯服人类第一步:教人重新说英语? 最近,越来越多的媒体发现:说话的方式,越来越像ChatGPT了! 这不是模仿,而是「入侵」。
7/16/2025 9:52:07 AM

AI 为何能查天气、订机票?揭秘大模型背后的“神秘工具箱”

你有没有想过,为什么 AI 能回答“今天上海天气怎么样? ”这种实时问题,甚至帮你预订机票? 明明它的训练数据截止到去年,怎么会对现在的事情了如指掌?
7/15/2025 9:44:16 AM
红绿灯灯灯灯

最新 AGI 暴论:强化学习的「GPT-3 时刻」实现,还需要 1 万年?

最近,国外一家 AI 初创公司 Mechanize 的三位创始人联合撰文,提出一个大胆的判断:RL 或许要迎来属于它的 “GPT-3 时刻”,但还需要拥有相当于数千至上万年“模型处理任务所用时间”的训练。 在他们看来,当前的 RL 模型还存在明显短板,比如泛化能力差、难以适应新任务等,这种局面其实很像 GPT-3 出现之前的语言模型——能解决特定问题,但难以迁移和扩展。 为了解决这个问题,他们提出了一种新的训练范式,叫作“复制训练”(Replication Training):让模型在虚拟环境中模拟真实软件的操作过程,比如使用浏览器、编写代码、处理命令行任务等等。
7/14/2025 4:36:00 PM
郑佳美

马斯克的Grok 4敢说ChatGPT不敢说的话?AI"政治正确"的边界在哪

一个明显的趋势是,AI大模型正在分化成两个阵营:一边是"政治正确"的主流AI,另一边是"敢说真话"的挑战者。 7月9日晚,马斯克的xAI正式发布Grok 4,宣称要打造"最强AI模型",而且绝不做"觉醒AI"。 这场发布会有点特别。
7/14/2025 1:55:00 AM
阿丸笔记