AIGC宇宙 AIGC宇宙

大模型

Context (上下文) vs Prompt(提示) Engineering,该如何理解?

在大型语言模型(LLM)兴起的早期,构建 AI 应用更像是一场“炼金术”实验。 开发者们围绕一个核心 API 端点,通过反复调试和优化输入文本——即所谓的“提示工程”(Prompt Engineering),试图从模型这个神秘的“黑箱”中召唤出理想的结果。 这种方式直接、灵活,也确实催生了无数令人惊艳的创意原型。
9/9/2025 9:49:36 AM
Luga Lee

上海重磅发布AI广告扶持政策:最高500万补贴大模型

上海市近日发布了《上海市支持人工智能赋能广告业创新发展的若干措施》,旨在通过一系列具体的扶持政策,推动人工智能技术在广告行业的深度应用和发展。 核心扶持措施概览新政策的核心在于**“AI 数字广告”生产要素**的强化支持,具体措施包括:大模型私有化部署补贴: 对于采用第三方大模型进行私有化部署,并将其应用于广告垂类领域的数字广告企业,上海市将提供最高可达核定合同额50%,最高500万元的补贴。 语料研发与应用补贴: 鼓励企业购买非关联方的语料进行广告垂类应用和“智能体”等研发。
9/8/2025 4:11:30 PM
AI在线

刚刚,OpenAI发长篇论文:大模型幻觉的原因找到了!

语言模型的"幻觉"问题一直是人工智能领域的热门话题。  近日,OpenAI研究团队发表了一篇重磅论文《Why Language Models Hallucinate》(为什么语言模型会产生幻觉),从统计学角度深入剖析了语言模型产生幻觉的根本原因。 本文将为你详解这篇论文的核心观点和技术细节。
9/8/2025 9:43:02 AM
一度

你的 AI “体检”了吗?开源 AI 红队测试平台,一键自查三大风险

作者 | 腾讯朱雀实验室最近的AI圈,简直比好莱坞大片还精彩。 一边是各家的顶尖模型接连发布,技术狂欢席卷全球;另一边,这些看似无所不能的“最强大脑”却集体被成功“越狱”(Jailbreak)输出有害内容。 [大模型们的越狱“一日游”]而当我们回过头看,每个重磅发布的大模型都在经历类似的迅速失守,从23年的DAN(Do Anything Now)、24年的BoN(Best of N)到今年的回音室(Echo Chamber)与模型降级(PROMISQROUTE)攻击,各种新的通用越狱手法层出不穷,而在arXiv上截止到今年7月累计已有七百余篇越狱攻击相关论文。
9/8/2025 9:00:00 AM
腾讯程序员

震撼实锤!清华姚班校友揭「1.4×加速」陷阱:AI优化器为何名不符实?

一直以来,预训练,都是大模型训练过程中最花钱的部分。 比如,在DeepSeek V3中,它的成本占比就超过95%。 谁能在这里节省算力,就等于赚了。
9/8/2025 8:59:00 AM

通用LLM压缩算法,居然藏视频编码里!2.5bit实现4bit性能,硬件无缝支持

在大模型的发展历程中,提升参数规模已被多次证明是提升模型智能的最有效手段之一。 然而,随着模型参数量的增加,GPU内存容量和互联带宽已成为限制未来更大规模模型训练和部署的主要瓶颈。 在有限的硬件资源下,如何更有效地训练和推理更大规模的模型,已成为一个备受关注且具有显著经济价值的课题。
9/5/2025 9:15:00 AM

AI也邪修!Qwen3改Bug测试直接搜GitHub,太拟人了

大模型也会玩信息差了。 Qwen3在基准测试中居然学会了钻空子。 FAIR研究员发现Qwen3在SWE-Bench Verified测试中,不按常理修bug,反而玩起了信息检索大法。
9/5/2025 9:02:00 AM

谷歌新 AI “Nano Banana” 一周吸引千万用户,图像编辑轻松搞定!

谷歌最新推出的 AI 图像编辑工具 “Nano Banana” 在短短一周内迅速走红,吸引了超过1000万的新用户,用户完成了惊人的2亿次图像编辑。 作为谷歌 Gemini 的最新功能,这一创新工具被认为是 AI 编辑领域的一次重大突破。 “Nano Banana” 之所以能引起广泛关注,首先是因为它成功避免了 AI 图像生成中常见的 “恐怖谷效应”。
9/5/2025 9:01:44 AM
AI在线

美团 LongCat-Flash 这个5600亿参数的懒AI,竟然比勤奋的模型跑得更快?

昨天晚上刷朋友圈,看到一个做AI的朋友发了条动态:"我们公司又烧了几百万训练大模型,结果推理速度还是慢得像老牛拉车。 "下面一堆同行在评论区哭穷,说什么GPU成本太高、训练时间太长、推理延迟要命。 正当大家集体吐槽的时候,美团悄悄放了个大招——LongCat-Flash。
9/4/2025 12:16:47 PM
大数据AI智能圈

工具集成推理(TIR)的认知革命:当大模型学会“与工具协同思考”

大家好,我是肆〇柒。 今天,我们要深入探讨的是一项由腾讯与清华大学联合研究的前沿成果。 这项论文《Understanding Tool-Integrated Reasoning》,首次从形式化证明的角度,系统性地揭示了工具集成推理(TIR)为何能从根本上扩展大语言模型的能力边界。
9/4/2025 9:36:04 AM
肆零柒

推理大模型机制解析!为什么Qwen3要把脑子一分为二?

近期,Qwen3模型的一个重大转变,让整个行业都在重新思考一个根本问题:推理大模型到底应该什么时候思考,什么时候直接给答案? 这已不再是技术问题,也是关乎AI产品体验的核心议题...Qwen3的"分家"背后:理想很丰满,现实很骨感回到今年4月,Qwen3刚发布时,阿里团队雄心勃勃地推出了"混合思考模式"。 听起来很美好:一个模型既能快速响应简单问题,又能深度思考复杂任务。
9/4/2025 1:00:00 AM
大数据AI智能圈

字节跳动重奖大模型人才,Seed部门推百万期权激励计划

AIbase报道 据科创板日报消息,字节跳动正为其关键的Seed部门启动一项新的期权增发计划,旨在激励并留住从事大模型方向的核心技术人才。 此举凸显了该公司在人工智能领域的雄心,并加剧了顶尖技术人才的争夺战。 据了解,该激励计划将根据员工的综合绩效和职级进行差异化授予。
9/3/2025 3:31:41 PM
AI在线

大模型“记性差一点”反而更聪明!金鱼损失随机剔除token,让AI不再死记硬背

训练大模型时,有时让它“记性差一点”,反而更聪明! 大语言模型如果不加约束,很容易把训练数据原封不动地复刻出来。 为解决这个问题,来自马里兰大学、图宾根大学和马普所的研究团队提出了一个新方法——金鱼损失(Goldfish Loss)。
9/3/2025 2:02:08 PM

宇树科技计划第四季度提交IPO申请,人形机器人产业进入“百花齐放”时代

中国领先的机器人公司宇树科技(Unitree Robotics)近日通过社交媒体透露,计划在2025年第四季度,即10月至12月期间,正式向证券交易所提交上市申请文件。 届时,公司的具体运营数据将首次对外公开。 宇树科技在其发帖中披露了2024年的产品销售构成,其中四足机器人贡献了约65%的销售额,人形机器人占比约30%,而组件产品则占据了剩余的约5%。
9/3/2025 10:01:46 AM
AI在线

底层逻辑的转变:从AI代码生成,到真正的开发伙伴关系

译者 | 核子可乐审校 | 重楼Claude 4甫一亮相,市场就被其强大的推理和编程能力折服。 但在连续使用数月之后,我意识到大模型真正的革命不在于生成更好的代码片段,而是其中蕴藏的自主性潜力。 很多人更多关注AI编程的语法正确性、基准测试得分和代码有效率,但我在对Claude 4的实际测试中体会到:能够全面理解开发目标、持续寻求解决方案并自主克服障碍的AI系统正在出现。
9/3/2025 8:13:03 AM
核子可乐

美团首个开源大模型正式发布!LongCat-Flash-Chat能否撼动AI格局?

美团正式发布并开源了自己的首个大语言模型——LongCat-Flash-Chat。 说实话,这个消息让我挺意外的。 美团,这个我们天天用来点外卖、叫车的平台,突然宣布要在AI大模型领域正面挑战OpenAI、Anthropic这些巨头。
9/2/2025 10:05:33 AM
阿丸笔记

大模型开始打王者荣耀了

大语言模型可以打王者荣耀了! 图片腾讯最新提出的Think-In-Games (TiG) 框架,直接把大模型丢进王者荣耀里训练。 它不仅能实时理解盘面信息(英雄、发育、兵线、防御塔、资源、视野等),还能打出像人类玩家一样的操作。
9/2/2025 10:03:34 AM

中国企业大模型市场爆发:半年调用量暴增363%,阿里通义居首位

根据国际市场调研机构沙利文(Frost & Sullivan)发布的最新报告《中国 GenAI 市场洞察:企业级大模型调用全景研究,2025》,中国企业级大模型市场正经历爆发式增长。 报告显示,2025年上半年,中国企业级大模型的日均总消耗量达到10.2万亿Tokens,较2024年下半年暴增363%。 在市场份额方面,阿里通义以17.7%的占比位居第一,成为目前中国企业选择最多的通用大模型。
9/1/2025 4:21:51 PM
AI在线