AIGC宇宙 AIGC宇宙

AI

工具集成推理(TIR)的认知革命:当大模型学会“与工具协同思考”

大家好,我是肆〇柒。 今天,我们要深入探讨的是一项由腾讯与清华大学联合研究的前沿成果。 这项论文《Understanding Tool-Integrated Reasoning》,首次从形式化证明的角度,系统性地揭示了工具集成推理(TIR)为何能从根本上扩展大语言模型的能力边界。
9/4/2025 9:36:04 AM
肆零柒

OpenAI免费开放ChatGPT Projects,3大功能太香了

今天凌晨3点50,OpenAI宣布向免费版ChatGPT开放Projects(项目)功能。 Projects功能最早发布于2024年的12月14日,也就是「AIGC开放社区」为大家介绍OpenAI连续12天技术直播的第7天。 自发布以来Projects一直是用户最喜欢的功能之一,不过是付费用户的专属,现在终于免费开放了。
9/4/2025 9:13:22 AM

推理大模型机制解析!为什么Qwen3要把脑子一分为二?

近期,Qwen3模型的一个重大转变,让整个行业都在重新思考一个根本问题:推理大模型到底应该什么时候思考,什么时候直接给答案? 这已不再是技术问题,也是关乎AI产品体验的核心议题...Qwen3的"分家"背后:理想很丰满,现实很骨感回到今年4月,Qwen3刚发布时,阿里团队雄心勃勃地推出了"混合思考模式"。 听起来很美好:一个模型既能快速响应简单问题,又能深度思考复杂任务。
9/4/2025 1:00:00 AM
大数据AI智能圈

大模型“记性差一点”反而更聪明!金鱼损失随机剔除token,让AI不再死记硬背

训练大模型时,有时让它“记性差一点”,反而更聪明! 大语言模型如果不加约束,很容易把训练数据原封不动地复刻出来。 为解决这个问题,来自马里兰大学、图宾根大学和马普所的研究团队提出了一个新方法——金鱼损失(Goldfish Loss)。
9/3/2025 2:02:08 PM

Anthropic 融资 130 亿美元,估值飙升至 1830 亿美元

近日,人工智能公司 Anthropic 宣布成功完成了一轮130亿美元的融资,交易后估值达到惊人的1830亿美元。 此次融资的领头投资方是知名投资公司 ICONIQ。 尽管科技行业在支出方面面临一些挑战和不确定性,但对于人工智能初创企业的投资热情依然高涨。
9/3/2025 10:01:50 AM
AI在线

刚刚,DeepSeek最新发文!V3/R1训练细节全公开,信息量巨大

今天,网信办《人工智能生成合成内容标识办法》正式生效。 其中,第四条要求:对符合要求的AI生成合成内容添加显式标识。 紧跟最新政策,DeepSeek出手了。
9/2/2025 10:17:07 AM

美团首个开源大模型正式发布!LongCat-Flash-Chat能否撼动AI格局?

美团正式发布并开源了自己的首个大语言模型——LongCat-Flash-Chat。 说实话,这个消息让我挺意外的。 美团,这个我们天天用来点外卖、叫车的平台,突然宣布要在AI大模型领域正面挑战OpenAI、Anthropic这些巨头。
9/2/2025 10:05:33 AM
阿丸笔记

被低估的GPT-5!OpenAI给7亿人解锁最强AI,大众智能一夜撕裂旧秩序

直到现在,GPT-5的升级,仍然被很多人低估了! 一方面是,很多人没有看透OpenAI发布GPT-5背后的真正原因。 GPT-5的「突破」不在性能,而是模型「自带路由」和思考配额分发下的「单位token经济学」。
9/1/2025 2:55:00 AM
新智元

亿万富翁丹・洛布减持台积电,转投另一家万亿人工智能公司

根据《华尔街日报》的报道,亿万富翁投资者丹・洛布近日减持了其在半导体制造公司(TSMC)的股份,出售了近29% 的持股,转而增持了另一家万亿市值的人工智能(AI)公司。 根据第三方的季度13F 文件,这一动向引发了市场的广泛关注。 图源备注:图片由AI生成,图片授权服务商Midjourney在过去的一年里,洛布的投资基金 Third Point 积极减持 TSMC 股票。
8/29/2025 6:27:05 PM
AI在线

数据科学新风口?三大环节搞定ML「资产」管理,VLDB'25最新教程抢先看!

大模型时代,模型、数据与各种「参数/脚本/许可证」等ML资产爆炸式增长,但真正能被发现、复用、合规使用的比例并不高,这正在成为AI生产力落地的「隐形天花板」。 以知名开源平台HuggingFace为例,平台目前托管超过150万个模型,每月还在新增约10万个模型,总数据存储量高达17PB。 然而超过半数的模型缺乏基本文档说明,不到8%的模型拥有明确的许可证。
8/29/2025 9:16:00 AM

一场「狼人杀」,考倒了一堆大模型

人工智能越来越像人,但“像人”到底意味着什么? 除了会解题、写文,它是否也能理解人类那种充满个性的推理方式? 比如在一场狼人杀游戏中,有人逻辑缜密、有人直觉敏锐、有人擅长伪装。
8/28/2025 1:49:00 PM
郑佳美

刚刚,全球AI百强榜发布!ChatGPT稳坐第一,DeepSeek第三,前50有22个来自中国

就在刚刚,a16z最新一期的「Top 100消费级GenAI应用榜单」出炉! 本期榜单传递出一个最核心信息:AI产品竞争的生态格局正日趋稳定! 网页排行前50移动应用排行前50不论是你常用的DeepSeek、豆包、夸克,还是一直领先的ChatGPT和Gemini,或者是新进榜单Lovable等,这场AI产品的「百团大战」依然在继续!
8/28/2025 10:07:18 AM
新智元

​OpenAI 与 Anthropic 进行首次合作测试,推动 AI 安全标准

在当前竞争激烈的人工智能(AI)领域,OpenAI 和 Anthropic 两家顶尖 AI 实验室决定进行一项前所未有的合作,联合对彼此的 AI 模型进行安全性测试。 这一举措旨在识别各自内部评估中的盲点,并展示在确保 AI 安全与对齐方面,领先企业之间如何能够携手共进。 OpenAI 联合创始人沃伊切赫・扎伦巴(Wojciech Zaremba)在接受采访时指出,随着 AI 技术逐步成熟并被广泛使用,这种跨实验室的合作显得尤为重要。
8/28/2025 9:40:57 AM
AI在线

半数英国成年人担忧 AI 对就业的影响,工会呼吁更大参与

根据最新民调显示,半数英国成年人对人工智能(AI)将如何影响他们的工作感到担忧。 这项由工会组织工人联合会(TUC)进行的调查结果显示,2600名受访者中有51% 的人表示,他们对 AI 可能导致的工作丢失或工作条件改变感到忧虑。 特别是在25至34岁之间的年轻工人中,近三分之二(62%)的人对 AI 的影响表示关注。
8/27/2025 5:11:21 PM
AI在线

Meta两员大将回流OpenAI,30天爆赚800万?刚入职闪回巢,小扎钞能力失效

成立仅两个月,小扎「梦之队」MSL已痛失三位核心大脑。 最新爆料称, 两位前OpenAI员工Avi Verma和Ethan Knight,加入Meta一个月再次回流到OpenAI。 1亿美金诱人薪酬包,也没能留住顶尖人才,难道小扎的「钞能力」真的失效了吗?
8/27/2025 3:39:11 PM

Claude抢跑OpenAI!上线插件杀入浏览器赛道!更放话:大势所趋!竞品昨日刚翻车,泄露用户密码!网友:AI别打钱给缅甸!

出品 | 51CTO技术栈(微信号:blog51cto)赢了 OpenAI 一步,没想到是 Claude 率先杀入 AI 浏览器赛道! Anthropic 已经启动“Claude for Chrome”内测,让AI 直接在网页里替你“点点点”,帮你订外卖、筛房源、甚至处理企业表单。 图片加入waitlist:,就被Claude端上了桌,这无疑是一场抢占先机的豪赌。
8/27/2025 2:02:32 PM
伊风

​技术人才对 AI 招聘工具的不信任:68% 专业人士表示担忧

在如今的招聘过程中,人工智能(AI)工具被广泛应用,但求职者的怀疑情绪日益加剧。 根据最新发布的 Dice 报告,68% 的科技专业人士对 AI 驱动的招聘系统表示不信任,同时80% 的人更倾向于人类主导的招聘方法。 报告显示,近30% 的受访者考虑完全离开科技行业,因为他们对 AI 增强招聘过程的挫败感更为强烈,尤其是女性群体对此反应更为明显。
8/26/2025 11:30:58 AM
AI在线

从 “只会聊天” 到 “能办实事”:OpenAI Function Call 彻底重构 AI 交互逻辑(附完整接入指南)

在 AI 开发领域,有一个痛点几乎所有开发者都遇到过:当你用 OpenAI 的 API 开发聊天机器人时,它能侃侃而谈,但让它帮你查天气、订机票、调用公司内部接口时,它要么答非所问,要么直接 “瞎编” 一个结果。 这不是大模型不够聪明,而是传统的 LLM(大语言模型)本质上是 “文本生成器”—— 它擅长根据上下文生成连贯的文字,但缺乏与外部系统交互的能力。 直到Function Calling(函数调用)出现,这个局面才被彻底打破。
8/26/2025 9:17:02 AM