理论

AI工具如何成为时间和成本的陷阱

周二下午2点，你本该在专心做重要项目，可实际上，过去三个小时你一直在测试在领英上发现的最新的AI工具。 “只是试试而已。 ”你这样想。

8/21/2025 7:00:00 AM

Mark

深度揭秘OpenAI如何让GPT-5「技术性」超越Claude：悄悄跳过最难的23道题

几天前，OpenAI发布会上，奥特曼宣布GPT-5登顶了，号称代码能力全球第一。但发布会上搞了一个大乌龙，52.8＞69.1=30.8？于是，OpenAI那些年薪上亿的天才们做的一张表格火遍了全世界（左边）。

8/20/2025 12:24:23 PM

DeepSeek V3.1 Base突袭上线！击败Claude 4编程爆表，全网在蹲R2和V4

就在昨晚，DeepSeek官方悄然上线了全新的V3.1版本，上下文长度拓展到128k。图片本次开源的V3.1模型拥有685B参数，支持多种精度格式，从BF16到FP8。综合公开信息和国内大咖karminski3的实测，V3.1此次更新亮点有：编程能力：表现突出，根据社区使用Aider测试数据，V3.1在开源模型中霸榜。

8/20/2025 9:57:40 AM

突发！DeepSeek刚刚开源V3.1-Base

今天凌晨，全球著名大模型开源平台DeepSeek开源了Deepseek V3.1-Base版本。非常低调没有任何介绍，只是把模型放上去了。但在Hugging Face的趋势榜单中已经上升到第4名，还是相当受欢迎的。

8/20/2025 9:35:20 AM

最懂Claude内部运作团队采访流出：大模型输出的思考全是拍马屁！曝自家减少幻觉路径；绝非只预测下一个词。网友：这都敢免费公开

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）上周末，Anthropic 团队放出了一个非常优质的播客。话题的敏感尺度很大，头排的听众们都替Claude担心了起来，惊呼：这种“核心机密”竟然敢免费公开吗？甚至有网友表示，第一次从头到尾把60分钟的播客听完了。

8/20/2025 8:34:48 AM

云昭

AI教父辛顿：人类需要AI成为“母亲”，李飞飞：反对！

“AI 会统治人类吗？ ”这个问题，早已不是科幻小说的专属。不如我们回顾下《爱，死亡与机器人》中那个荒诞又深刻的故事——《当酸奶统治世界》。

8/20/2025 7:53:01 AM

DataFun

ACM MM 2025 | 小红书AIGC团队提出风格迁移加速新算法STD

基于一致性模型（Consistency Models, CMs）的轨迹蒸馏（Trajectory Distillation）为加速扩散模型提供了一个有效框架，通过减少推理步骤来提升效率。然而，现有的一致性模型在风格化任务中会削弱风格相似性，并损害美学质量 —— 尤其是在处理从部分加噪输入开始去噪的图像到图像（image-to-image）或视频到视频（video-to-video）变换任务时问题尤为明显。这一核心问题源于当前方法要求学生模型的概率流常微分方程（PF-ODE）轨迹在初始步骤与其不完美的教师模型对齐。

8/20/2025 7:49:28 AM

GPT 4o-mini华人领队离开OpenAI：真正推动AI进步不是模型架构，而是互联网

刚刚，OpenAI又离职一名华人大佬。前OpenAI研究员Kevin Lu宣布加入AI新创Thinking Machines Lab。 Kevin Lu主导了GPT-4o mini的发布，并参与o*-mini、o3等模型工作。

8/19/2025 3:58:59 PM

阿里千问踢馆子了！Qwen3新作秒杀ChatGPT，侧脸杀切换第一人称视角，表情包绝绝子，小编：再也不用美图秀秀去水印了

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）好家活！千问这是要干嘛，简直要踢了GPT-5的馆子了！就在刚刚，小编发现，千问官方X账号“Qwen”宣布：Qwen图像编辑功能重磅上线了！

8/19/2025 12:00:26 PM

云昭

告别人工写脚本！多模态大模型驱动携程UI自动化测试迈入“描述即生成”阶段

作者简介Jessi Peng，携程资深后端开发工程师，关注AI技术在测试领域的应用。一、引言在传统的UI自动化测试流程中，测试人员需要构建完整的开发环境，包括Python运行环境、PyCharm集成开发环境、自动化测试框架等工具链的配置与部署。在用例编写过程中，测试人员必须通过人工方式精确定位目标UI元素，并基于自动化框架封装的底层方法，手工编写测试代码。

8/19/2025 10:47:17 AM

Jessi Peng

所谓"廉价"的开源AI模型正在吞噬你的算力预算

一项全新的综合研究表明，在执行相同任务时，开源AI模型比闭源竞争对手消耗的计算资源要多得多，这可能会削弱其成本优势，并重塑企业评估AI部署策略的方式。该研究由AI公司Nous Research开展，发现开放权重模型使用的token(AI计算的基本单位)数量是OpenAI和Anthropic等闭源模型的1.5到4倍，对于简单的知识问答，差距会大幅扩大，某些开源模型使用的token数量最多可达闭源模型的10倍。研究人员在周三发布的报告中写道：“开放权重模型使用的token数量是闭源模型的1.5至4倍(对于简单的知识问答，这一差距可达10倍)，因此尽管每个token的成本较低，但每次查询的成本有时反而更高。

8/19/2025 7:07:00 AM

Michae

OpenAI 开源模型被 Meta 研究员“逆改”！只动0.3%参数，gpt-oss-20B 解锁无约束基座

OpenAI在8月初发布了开放权重模型家族gpt-oss，这是公司自2019年GPT-2以来首次真正意义上的开源动作。仅仅两周后，一位研究者就将这一模型“拆解重组”，推出了与官方版本迥异的变体。康奈尔大学博士生、前Google Brain成员、现任Meta研究员的Jack Morris，公开了名为gpt-oss-20b-base的新版本。

8/19/2025 2:10:00 AM

一句话，性能暴涨49%！马里兰MIT等力作：Prompt才是大模型终极武器

AI性能的提升，一半靠模型，一半靠提示词。最近，来自马里兰大学、MIT、斯坦福等机构联手验证，模型升级带来的性能提升仅占50%，而另外一半的提升，在于用户提示词的优化。他们将其称之为「提示词适应」（prompt adaptation）。

8/18/2025 5:20:17 PM

AI版华尔街之狼！o3-mini靠「神之押注」狂赚9倍，DeepSeek R1最特立独行

AI能预测未来吗？在《黑客帝国》里，先知能对Neo的未来做出预测。以ChatGPT为代表的AI，则可以根据过去的语料来「预测下一个Token」。

8/18/2025 5:16:45 PM

OpenAI总裁透露GPT-5改了推理范式，AGI实现要靠现实反馈

OpenAI的AGI之路，总裁Greg Brockman在最新的访谈中说清楚了——技术层面，从文本生成转向强化学习的推理范式，在现实世界中试错并获取反馈；资源策略上，持续投入大规模计算资源；落地环节，把模型封装成Agent，将模型能力打包成为可审计的服务进程。图片这场访谈由AI播客Latent Space主持，与Brockman探讨了OpenAI的AGI的整体技术路线与资源策略。与此同时，OpenAI的落地布局，以及Brockman对未来的思考，也都随着访谈的进行浮出水面。

8/18/2025 5:14:41 PM

量子位

从GPT-2到gpt-oss，深度详解OpenAI开放模型的进化之路

众所周知，OpenAI 并不够 Open，不仅研究论文发得越来越少，开源模型也是千呼万唤始出来。其近日发布的两个 gpt-oss 开源模型已经吸引了无数关注，网上也已经出现了不少解读文章或视频。近日，我们熟悉的 Sebastian Raschka 也发布了一篇深度技术博客，对 gpt-oss 进行了详细分析，并回顾了自 GPT-2 以来 AI 社区取得的进步；此外，他还将其与 Qwen 3 进行了比较。

8/18/2025 1:34:00 PM

机器之心

GPT-5遭用户吐槽 “垃圾”：缩放定律失效，AGI梦渐行渐远？

2025 年 8 月，OpenAI 终于推出备受期待的 GPT-5，但其表现并未如市场预期般带来 “革命性突破”，反而让 “AI 进步失速”“缩放定律失效” 的讨论再度升温。 GPT-5 实测：亮点有限，失望声四起YouTube播主 Mrwhosetheboss 的实测显示，GPT-5 并非全面领先：在创建象棋游戏时优于 . GPT-4o-mini-high，撰写视频脚本时强于 GPT-4o，且能根据任务自动匹配最优模型；但在生成 YouTube .

8/18/2025 9:57:30 AM

OpenAI突然"背叛"自己：推理与创作分家，万能AI时代终结？

83.3%对比13%——这不是什么投票结果，而是OpenAI两类模型在高级数学问题上的表现差距。更震撼的是，表现更好的那个模型，在创意写作方面反而输给了"落后"的那个。我花了一下午时间深挖OpenAI的最新技术文档，发现了一个颠覆认知的事实：OpenAI已经悄悄放弃了"万能AI"的路线，转向了一个更精妙的策略——让不同的模型专做不同的事。

8/18/2025 9:17:54 AM

阿丸笔记

资讯热榜

印度创新试点：AI 聊天机器人助力电子商务购物新方式两部门联合发布《政务领域人工智能大模型部署应用指引》大力推动AI技术应用马斯克 xAI 在孟菲斯开建全球最大污水处理厂，年节约饮用水达 190 亿升软银贷款50亿美元助力AI投资，孙正义押注未来科技！ OpenAI新研究称GPT-5为迄今“政治偏见最少”的AI模型 Sora2公布提示词指南！直接抄作业能玩一整天！前DeepMind大神创业一年估值飙至80亿美元：Reflection AI要做美国版DeepSeek OpenAI Sora 引爆 App Store“山寨潮”:30万次下载!苹果审核机制遭质疑

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画机器人数据大模型 Midjourney 开源 Meta 智能微软用户 AI新词 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练论文代码 LLM 算法 Stable Diffusion 芯片腾讯苹果 AI for Science Agent Claude 蛋白质开发者生成式神经网络 xAI 机器学习 3D 研究人形机器人生成 AI视频百度工具 RAG 大语言模型 Sora 华为 GPU 计算具身智能 AI设计字节跳动搜索大型语言模型 AGI 场景深度学习视频生成架构预测视觉伟达 DeepMind Transformer 编程神器推荐 AI模型亚马逊 MCP

理论