AI
工具集成推理(TIR)的认知革命:当大模型学会“与工具协同思考”
大家好,我是肆〇柒。 今天,我们要深入探讨的是一项由腾讯与清华大学联合研究的前沿成果。 这项论文《Understanding Tool-Integrated Reasoning》,首次从形式化证明的角度,系统性地揭示了工具集成推理(TIR)为何能从根本上扩展大语言模型的能力边界。
9/4/2025 9:36:04 AM
肆零柒
OpenAI免费开放ChatGPT Projects,3大功能太香了
今天凌晨3点50,OpenAI宣布向免费版ChatGPT开放Projects(项目)功能。 Projects功能最早发布于2024年的12月14日,也就是「AIGC开放社区」为大家介绍OpenAI连续12天技术直播的第7天。 自发布以来Projects一直是用户最喜欢的功能之一,不过是付费用户的专属,现在终于免费开放了。
9/4/2025 9:13:22 AM
推理大模型机制解析!为什么Qwen3要把脑子一分为二?
近期,Qwen3模型的一个重大转变,让整个行业都在重新思考一个根本问题:推理大模型到底应该什么时候思考,什么时候直接给答案? 这已不再是技术问题,也是关乎AI产品体验的核心议题...Qwen3的"分家"背后:理想很丰满,现实很骨感回到今年4月,Qwen3刚发布时,阿里团队雄心勃勃地推出了"混合思考模式"。 听起来很美好:一个模型既能快速响应简单问题,又能深度思考复杂任务。
9/4/2025 1:00:00 AM
大数据AI智能圈
大模型“记性差一点”反而更聪明!金鱼损失随机剔除token,让AI不再死记硬背
训练大模型时,有时让它“记性差一点”,反而更聪明! 大语言模型如果不加约束,很容易把训练数据原封不动地复刻出来。 为解决这个问题,来自马里兰大学、图宾根大学和马普所的研究团队提出了一个新方法——金鱼损失(Goldfish Loss)。
9/3/2025 2:02:08 PM
Anthropic 融资 130 亿美元,估值飙升至 1830 亿美元
近日,人工智能公司 Anthropic 宣布成功完成了一轮130亿美元的融资,交易后估值达到惊人的1830亿美元。 此次融资的领头投资方是知名投资公司 ICONIQ。 尽管科技行业在支出方面面临一些挑战和不确定性,但对于人工智能初创企业的投资热情依然高涨。
9/3/2025 10:01:50 AM
AI在线
刚刚,DeepSeek最新发文!V3/R1训练细节全公开,信息量巨大
今天,网信办《人工智能生成合成内容标识办法》正式生效。 其中,第四条要求:对符合要求的AI生成合成内容添加显式标识。 紧跟最新政策,DeepSeek出手了。
9/2/2025 10:17:07 AM
美团首个开源大模型正式发布!LongCat-Flash-Chat能否撼动AI格局?
美团正式发布并开源了自己的首个大语言模型——LongCat-Flash-Chat。 说实话,这个消息让我挺意外的。 美团,这个我们天天用来点外卖、叫车的平台,突然宣布要在AI大模型领域正面挑战OpenAI、Anthropic这些巨头。
9/2/2025 10:05:33 AM
阿丸笔记
被低估的GPT-5!OpenAI给7亿人解锁最强AI,大众智能一夜撕裂旧秩序
直到现在,GPT-5的升级,仍然被很多人低估了! 一方面是,很多人没有看透OpenAI发布GPT-5背后的真正原因。 GPT-5的「突破」不在性能,而是模型「自带路由」和思考配额分发下的「单位token经济学」。
9/1/2025 2:55:00 AM
新智元
亿万富翁丹・洛布减持台积电,转投另一家万亿人工智能公司
根据《华尔街日报》的报道,亿万富翁投资者丹・洛布近日减持了其在半导体制造公司(TSMC)的股份,出售了近29% 的持股,转而增持了另一家万亿市值的人工智能(AI)公司。 根据第三方的季度13F 文件,这一动向引发了市场的广泛关注。 图源备注:图片由AI生成,图片授权服务商Midjourney在过去的一年里,洛布的投资基金 Third Point 积极减持 TSMC 股票。
8/29/2025 6:27:05 PM
AI在线
数据科学新风口?三大环节搞定ML「资产」管理,VLDB'25最新教程抢先看!
大模型时代,模型、数据与各种「参数/脚本/许可证」等ML资产爆炸式增长,但真正能被发现、复用、合规使用的比例并不高,这正在成为AI生产力落地的「隐形天花板」。 以知名开源平台HuggingFace为例,平台目前托管超过150万个模型,每月还在新增约10万个模型,总数据存储量高达17PB。 然而超过半数的模型缺乏基本文档说明,不到8%的模型拥有明确的许可证。
8/29/2025 9:16:00 AM
一场「狼人杀」,考倒了一堆大模型
人工智能越来越像人,但“像人”到底意味着什么? 除了会解题、写文,它是否也能理解人类那种充满个性的推理方式? 比如在一场狼人杀游戏中,有人逻辑缜密、有人直觉敏锐、有人擅长伪装。
8/28/2025 1:49:00 PM
郑佳美
刚刚,全球AI百强榜发布!ChatGPT稳坐第一,DeepSeek第三,前50有22个来自中国
就在刚刚,a16z最新一期的「Top 100消费级GenAI应用榜单」出炉! 本期榜单传递出一个最核心信息:AI产品竞争的生态格局正日趋稳定! 网页排行前50移动应用排行前50不论是你常用的DeepSeek、豆包、夸克,还是一直领先的ChatGPT和Gemini,或者是新进榜单Lovable等,这场AI产品的「百团大战」依然在继续!
8/28/2025 10:07:18 AM
新智元
OpenAI 与 Anthropic 进行首次合作测试,推动 AI 安全标准
在当前竞争激烈的人工智能(AI)领域,OpenAI 和 Anthropic 两家顶尖 AI 实验室决定进行一项前所未有的合作,联合对彼此的 AI 模型进行安全性测试。 这一举措旨在识别各自内部评估中的盲点,并展示在确保 AI 安全与对齐方面,领先企业之间如何能够携手共进。 OpenAI 联合创始人沃伊切赫・扎伦巴(Wojciech Zaremba)在接受采访时指出,随着 AI 技术逐步成熟并被广泛使用,这种跨实验室的合作显得尤为重要。
8/28/2025 9:40:57 AM
AI在线
半数英国成年人担忧 AI 对就业的影响,工会呼吁更大参与
根据最新民调显示,半数英国成年人对人工智能(AI)将如何影响他们的工作感到担忧。 这项由工会组织工人联合会(TUC)进行的调查结果显示,2600名受访者中有51% 的人表示,他们对 AI 可能导致的工作丢失或工作条件改变感到忧虑。 特别是在25至34岁之间的年轻工人中,近三分之二(62%)的人对 AI 的影响表示关注。
8/27/2025 5:11:21 PM
AI在线
Meta两员大将回流OpenAI,30天爆赚800万?刚入职闪回巢,小扎钞能力失效
成立仅两个月,小扎「梦之队」MSL已痛失三位核心大脑。 最新爆料称, 两位前OpenAI员工Avi Verma和Ethan Knight,加入Meta一个月再次回流到OpenAI。 1亿美金诱人薪酬包,也没能留住顶尖人才,难道小扎的「钞能力」真的失效了吗?
8/27/2025 3:39:11 PM
Claude抢跑OpenAI!上线插件杀入浏览器赛道!更放话:大势所趋!竞品昨日刚翻车,泄露用户密码!网友:AI别打钱给缅甸!
出品 | 51CTO技术栈(微信号:blog51cto)赢了 OpenAI 一步,没想到是 Claude 率先杀入 AI 浏览器赛道! Anthropic 已经启动“Claude for Chrome”内测,让AI 直接在网页里替你“点点点”,帮你订外卖、筛房源、甚至处理企业表单。 图片加入waitlist:,就被Claude端上了桌,这无疑是一场抢占先机的豪赌。
8/27/2025 2:02:32 PM
伊风
技术人才对 AI 招聘工具的不信任:68% 专业人士表示担忧
在如今的招聘过程中,人工智能(AI)工具被广泛应用,但求职者的怀疑情绪日益加剧。 根据最新发布的 Dice 报告,68% 的科技专业人士对 AI 驱动的招聘系统表示不信任,同时80% 的人更倾向于人类主导的招聘方法。 报告显示,近30% 的受访者考虑完全离开科技行业,因为他们对 AI 增强招聘过程的挫败感更为强烈,尤其是女性群体对此反应更为明显。
8/26/2025 11:30:58 AM
AI在线
从 “只会聊天” 到 “能办实事”:OpenAI Function Call 彻底重构 AI 交互逻辑(附完整接入指南)
在 AI 开发领域,有一个痛点几乎所有开发者都遇到过:当你用 OpenAI 的 API 开发聊天机器人时,它能侃侃而谈,但让它帮你查天气、订机票、调用公司内部接口时,它要么答非所问,要么直接 “瞎编” 一个结果。 这不是大模型不够聪明,而是传统的 LLM(大语言模型)本质上是 “文本生成器”—— 它擅长根据上下文生成连贯的文字,但缺乏与外部系统交互的能力。 直到Function Calling(函数调用)出现,这个局面才被彻底打破。
8/26/2025 9:17:02 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
AI新词
微软
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
Agent
AI for Science
芯片
苹果
Claude
腾讯
Stable Diffusion
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
RAG
人形机器人
AI视频
研究
大语言模型
生成
具身智能
Sora
工具
GPU
百度
华为
计算
字节跳动
AI设计
大型语言模型
AGI
搜索
视频生成
场景
深度学习
架构
生成式AI
DeepMind
编程
亚马逊
视觉
Transformer
AI模型
预测
特斯拉
MCP