人工智能
工具集成推理(TIR)的认知革命:当大模型学会“与工具协同思考”
                        大家好,我是肆〇柒。 今天,我们要深入探讨的是一项由腾讯与清华大学联合研究的前沿成果。 这项论文《Understanding Tool-Integrated Reasoning》,首次从形式化证明的角度,系统性地揭示了工具集成推理(TIR)为何能从根本上扩展大语言模型的能力边界。
                    
                    9/4/2025 9:36:04 AM
                        肆零柒
                    推理大模型机制解析!为什么Qwen3要把脑子一分为二?
                        近期,Qwen3模型的一个重大转变,让整个行业都在重新思考一个根本问题:推理大模型到底应该什么时候思考,什么时候直接给答案? 这已不再是技术问题,也是关乎AI产品体验的核心议题...Qwen3的"分家"背后:理想很丰满,现实很骨感回到今年4月,Qwen3刚发布时,阿里团队雄心勃勃地推出了"混合思考模式"。 听起来很美好:一个模型既能快速响应简单问题,又能深度思考复杂任务。
                    
                    9/4/2025 1:00:00 AM
                        大数据AI智能圈
                    OpenAI即将在印度建造超大型数据中心,或将引领AI技术新潮流
                        近日,有消息称,人工智能巨头 OpenAI 正在计划在印度建立一座大型数据中心,这一举动可能会成为其 “星际之门”(Stargate)品牌 AI 基础设施在亚洲发展的重要里程碑。 根据知情人士透露,OpenAI 正在寻求当地合作伙伴,并计划建造一座至少容纳1千兆瓦电力的数据中心。 这一新数据中心有望成为印度规模最大的之一。
                    
                    9/1/2025 5:46:53 PM
                        AI在线
                    「精而巧」的端侧大模型为何火了?
                        大模型爆火伊始,很多厂商提的最多的就是自家的模型(云端大模型)参数有多大,性能有多好。 但近两年,相较云端大模型外,端侧大模型的热度被炒的越来越高。 很重要的原因在于,越来越多的厂商开始布局端侧大模型赛道。
                    
                    8/27/2025 4:05:39 PM
                        
                    联合国成立人工智能咨询小组
                        联合国大会周二做出一项重要决定,成立了一个人工智能咨询机构。 该机构旨在为各国在人工智能这一革命性技术方面的决策提供有力支持。 图源备注:图片由AI生成,图片授权服务商Midjourney由于人工智能飞速发展,其对生活的改变超乎想象,成员国对此深感担忧。
                    
                    8/27/2025 1:41:44 PM
                        AI在线
                    宾州州立大学推出首个人工智能工程学位,抢占教育先机
                        随着人工智能逐渐融入我们的日常生活,宾州州立大学(Penn State University)正在教育领域开创新局面,推出全新的人工智能工程学士学位。 这一学位被认为是全美首批此类专业之一,旨在培养具备未来科技能力的人才。 图源备注:图片由AI生成,图片授权服务商Midjourney该学位课程将包括基础数学和科学课程,以帮助学生打下坚实的理论基础。
                    
                    8/27/2025 11:42:37 AM
                        AI在线
                    Meta豪掷重金拿下Midjourney授权!扎克伯格AI军备竞赛再下一城
                        硅谷巨头Meta又有大动作了!Meta首席AI官亚历山大·王周五在Threads上宣布,公司已与AI图像生成独角兽Midjourney达成技术授权合作协议,这标志着Meta在人工智能领域的布局再次提速。 王表示,Meta研究团队将与Midjourney深度合作,将后者的先进技术整合到未来的AI模型和产品中。 他强调:"要确保Meta能为用户提供最优质的产品体验,就必须采用全方位策略。
                    
                    8/25/2025 9:37:16 AM
                        AI在线
                    OpenAI 提议为全体英国人免费提供 ChatGPT Plus,潜在成本高达 20 亿英镑
                        最近,英国《卫报》报道了一项引人注目的提议:OpenAI 首席执行官萨姆・奥尔特曼与英国科技大臣彼得・凯尔讨论,希望为英国民众免费提供 ChatGPT Plus 订阅服务。 这项提议的潜在成本高达20亿英镑(约合193.22亿元人民币),但最终未能实现。 图源备注:图片由AI生成,图片授权服务商Midjourney根据知情人士的透露,这一构想是在旧金山的一次会议上提出的,旨在寻求 OpenAI 与英国之间更广泛的合作机会。
                    
                    8/25/2025 9:36:56 AM
                        AI在线
                    大模型的基石:LLM预训练全解析
                        前言过去几年,大语言模型(LLM, Large Language Models)逐渐成为人工智能领域的核心驱动力。 从GPT到LLaMA,再到国内外涌现的大大小小模型,它们无一不是在“预训练”这一步骤中打下了坚实的基础。 可以说,预训练是LLM的生命起点,是它们从“婴儿”成长为“博学者”的关键阶段。
                    
                    8/24/2025 9:24:07 AM
                        AI大模型应用开发
                    DeepSeek V3.1:低调发布,重磅发声
                        译者 | 李睿审校 | 重楼DeepSeek V3.1的发布并没有举办大张旗鼓的新闻发布会,也没有铺天盖地的宣传活动。 它在Hugging Face平台上悄然发布,在短短数小时内就吸引了众人的目光。 该模型拥有6850亿个参数,上下文窗口可扩展至128k个令牌,这不仅仅是增量更新,而是开源人工智能领域的一个重要里程碑。
                    
                    8/23/2025 8:20:29 AM
                        
                    李睿
                    OpenAI 正式进驻印度,计划在新德里设立办公室
                        近日,OpenAI 宣布将正式进军印度市场,并计划在新德里开设一间新的办公室。 这一消息意味着 OpenAI 在全球范围内的扩展策略再度加速,标志着其对印度这一关键市场的重视。 随着人工智能技术的快速发展,印度的市场潜力吸引了众多科技公司的目光,OpenAI 作为人工智能领域的领军者,自然不愿错过这个机会。
                    
                    8/22/2025 2:46:23 PM
                        AI在线
                    71% 的美国人忧虑 AI 将永久性失业
                        根据最新的 Reuters 与 Ipsos 联合调查,超过70% 的美国成年人对人工智能(AI)可能导致的工作岗位消失感到担忧。 这项调查共访问了4,446名美国成年人,结果显示,71% 的受访者表示,他们担心 AI 会 “永久性” 取代大量美国工人的工作。 与此同时,微软的一份研究报告也指出了最有可能被 AI 自动化的职位,信息处理和沟通相关的角色,如翻译和客户服务代表,位列其中。
                    
                    8/22/2025 10:54:48 AM
                        AI在线
                    DeepSeek-V3.1发布:专为国产芯片设计浮点数格式
                        近日,深度求索(DeepSeek)正式发布新一代大模型 DeepSeek-V3.1,并首次公开提及采用“UE8M0 FP8 Scale”参数精度。 这一技术细节的披露,迅速引发行业关注。 官方在公众号文章中进一步解释,UE8M0 FP8 是专为下一代国产芯片设计的浮点数格式,旨在提升计算效率并降低资源消耗。
                    
                    8/22/2025 9:31:38 AM
                        极客AI
                    AI工具如何成为时间和成本的陷阱
                        周二下午2点,你本该在专心做重要项目,可实际上,过去三个小时你一直在测试在领英上发现的最新的AI工具。 “只是试试而已。 ”你这样想。
                    
                    8/21/2025 7:00:00 AM
                        Mark
                    超过 70% 美国民众对 AI 的未来忧虑:就业与人际关系面临挑战
                        随着人工智能技术的迅速发展,各大科技公司频频宣称其工具将彻底改变世界,提高工作效率,减少枯燥劳动。 然而,一项最新的调查显示,超过七成的美国人对这一技术表示担忧,认为人工智能可能导致大量永久失业。 自从2023年 ChatGPT 爆火以来,关于生成式人工智能的讨论愈发热烈,有专家警告说,这场革命将引发自工业革命以来前所未有的失业潮。
                    
                    8/20/2025 10:06:00 AM
                        AI在线
                    AI教父辛顿:人类需要AI成为“母亲”,李飞飞:反对!
                        “AI 会统治人类吗? ”这个问题,早已不是科幻小说的专属。 不如我们回顾下《爱,死亡与机器人》中那个荒诞又深刻的故事——《当酸奶统治世界》。
                    
                    8/20/2025 7:53:01 AM
                        DataFun
                    ACM MM 2025 | 小红书AIGC团队提出风格迁移加速新算法STD
                        基于一致性模型(Consistency Models, CMs)的轨迹蒸馏(Trajectory Distillation)为加速扩散模型提供了一个有效框架,通过减少推理步骤来提升效率。 然而,现有的一致性模型在风格化任务中会削弱风格相似性,并损害美学质量 —— 尤其是在处理从部分加噪输入开始去噪的图像到图像(image-to-image)或视频到视频(video-to-video)变换任务时问题尤为明显。 这一核心问题源于当前方法要求学生模型的概率流常微分方程(PF-ODE)轨迹在初始步骤与其不完美的教师模型对齐。
                    
                    8/20/2025 7:49:28 AM
                        
                    所谓"廉价"的开源AI模型 正在吞噬你的算力预算
                        一项全新的综合研究表明,在执行相同任务时,开源AI模型比闭源竞争对手消耗的计算资源要多得多,这可能会削弱其成本优势,并重塑企业评估AI部署策略的方式。 该研究由AI公司Nous Research开展,发现开放权重模型使用的token(AI计算的基本单位)数量是OpenAI和Anthropic等闭源模型的1.5到4倍,对于简单的知识问答,差距会大幅扩大,某些开源模型使用的token数量最多可达闭源模型的10倍。 研究人员在周三发布的报告中写道:“开放权重模型使用的token数量是闭源模型的1.5至4倍(对于简单的知识问答,这一差距可达10倍),因此尽管每个token的成本较低,但每次查询的成本有时反而更高。
                    
                    8/19/2025 7:07:00 AM
                        Michae
                    
        资讯热榜
    
    
        标签云
    
    
                    
                    AI
                    
                    
                    人工智能
                    
                    
                    OpenAI
                    
                    
                    AIGC
                    
                    
                    模型
                    
                    
                    ChatGPT
                    
                    
                    DeepSeek
                    
                    
                    谷歌
                    
                    
                    AI绘画
                    
                    
                    大模型
                    
                    
                    机器人
                    
                    
                    数据
                    
                    
                    Midjourney
                    
                    
                    开源
                    
                    
                    Meta
                    
                    
                    微软
                    
                    
                    智能
                    
                    
                    AI新词
                    
                    
                    用户
                    
                    
                    GPT
                    
                    
                    学习
                    
                    
                    技术
                    
                    
                    智能体
                    
                    
                    马斯克
                    
                    
                    Gemini
                    
                    
                    图像
                    
                    
                    Anthropic
                    
                    
                    英伟达
                    
                    
                    AI创作
                    
                    
                    训练
                    
                    
                    LLM
                    
                    
                    论文
                    
                    
                    代码
                    
                    
                    算法
                    
                    
                    Agent
                    
                    
                    AI for Science
                    
                    
                    芯片
                    
                    
                    苹果
                    
                    
                    腾讯
                    
                    
                    Claude
                    
                    
                    Stable Diffusion
                    
                    
                    蛋白质
                    
                    
                    开发者
                    
                    
                    生成式
                    
                    
                    神经网络
                    
                    
                    xAI
                    
                    
                    机器学习
                    
                    
                    3D
                    
                    
                    RAG
                    
                    
                    人形机器人
                    
                    
                    研究
                    
                    
                    AI视频
                    
                    
                    大语言模型
                    
                    
                    生成
                    
                    
                    具身智能
                    
                    
                    Sora
                    
                    
                    工具
                    
                    
                    GPU
                    
                    
                    百度
                    
                    
                    华为
                    
                    
                    计算
                    
                    
                    字节跳动
                    
                    
                    AI设计
                    
                    
                    AGI
                    
                    
                    大型语言模型
                    
                    
                    搜索
                    
                    
                    视频生成
                    
                    
                    场景
                    
                    
                    深度学习
                    
                    
                    架构
                    
                    
                    生成式AI
                    
                    
                    DeepMind
                    
                    
                    编程
                    
                    
                    视觉
                    
                    
                    Transformer
                    
                    
                    预测
                    
                    
                    AI模型
                    
                    
                    MCP
                    
                    
                    伟达
                    
                    
                    亚马逊