文章列表

分类

标签

ACM MM 2025 | 小红书AIGC团队提出风格迁移加速新算法STD

基于一致性模型（Consistency Models, CMs）的轨迹蒸馏（Trajectory Distillation）为加速扩散模型提供了一个有效框架，通过减少推理步骤来提升效率。然而，现有的一致性模型在风格化任务中会削弱风格相似性，并损害美学质量 —— 尤其是在处理从部分加噪输入开始去噪的图像到图像（image-to-image）或视频到视频（video-to-video）变换任务时问题尤为明显。这一核心问题源于当前方法要求学生模型的概率流常微分方程（PF-ODE）轨迹在初始步骤与其不完美的教师模型对齐。

8/20/2025 7:49:28 AM

AI绘画史诗级升级！8个案例实测人物一致性新模型Nano Banana

是不是以为我又标题党了。但是这玩意我觉得真的够强，在我实际工作中也已经用上好几天，所以，体验下来，我是真的觉得对得这个史诗级名号。这个神秘的AI绘图的新模型，叫做，Nano Banana。

8/20/2025 2:02:08 AM

数字生命卡兹克

DeepSeek V3.1正式发布:长文档分析、代码理解能力大幅增强，R2仍需等待

8月19日晚间，DeepSeek 官方宣布线上模型版本已升级至 V3.1，最显著的改进是上下文长度拓展至 128K，相当于可处理 10万至13万汉字的超长文本，适用于长文档分析、代码库理解及多轮对话场景。用户现可通过官网、App 或微信小程序体验新版本，API 接口调用方式保持不变，开发者无需额外调整即可无缝切换。此次升级并非大版本迭代，而是对 V3模型的优化。

8/19/2025 10:56:40 PM

AI在线

奥特曼：我承认GPT-5发布搞砸了

闻乐发自凹非寺. 量子位 | 公众号 QbitAI奥特曼终于承认他搞砸了。要说最近AI圈的大型翻车现场，GPT-5的发布绝对能排得上号。

8/19/2025 4:48:47 PM

闻乐

GPT 4o-mini华人领队离开OpenAI：真正推动AI进步不是模型架构，而是互联网

刚刚，OpenAI又离职一名华人大佬。前OpenAI研究员Kevin Lu宣布加入AI新创Thinking Machines Lab。 Kevin Lu主导了GPT-4o mini的发布，并参与o*-mini、o3等模型工作。

8/19/2025 3:58:59 PM

7年了，OpenAI官方给出五代GPT对比，网友却怀念起「狂野」初代

从2018年至今，GPT系列模型已经来到第五代，如果让你回忆第一次使用GPT-1时的感受，可能是一种新奇却略显笨拙的震撼，就像这样：当你问 GPT-1：麻醉状态下，你真的有意识吗？它的回答很生硬，甚至有些胡言乱语：我没有。你醒了。

8/19/2025 2:55:00 PM

机器之心

阿里千问踢馆子了！Qwen3新作秒杀ChatGPT，侧脸杀切换第一人称视角，表情包绝绝子，小编：再也不用美图秀秀去水印了

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）好家活！千问这是要干嘛，简直要踢了GPT-5的馆子了！就在刚刚，小编发现，千问官方X账号“Qwen”宣布：Qwen图像编辑功能重磅上线了！

8/19/2025 12:00:26 PM

云昭

告别人工写脚本！多模态大模型驱动携程UI自动化测试迈入“描述即生成”阶段

作者简介Jessi Peng，携程资深后端开发工程师，关注AI技术在测试领域的应用。一、引言在传统的UI自动化测试流程中，测试人员需要构建完整的开发环境，包括Python运行环境、PyCharm集成开发环境、自动化测试框架等工具链的配置与部署。在用例编写过程中，测试人员必须通过人工方式精确定位目标UI元素，并基于自动化框架封装的底层方法，手工编写测试代码。

8/19/2025 10:47:17 AM

Jessi Peng

小红书发布DynamicFace人脸生成技术，实现高质量图像视频人脸融合

小红书AIGC团队近日正式发布了名为DynamicFace的可控人脸生成技术。据官方介绍，这项技术专门针对图像和视频领域的人脸融合任务进行优化，能够实现高质量与高度一致性的人脸置换效果。 DynamicFace技术的推出标志着小红书在AI内容生成领域的重要技术突破。

8/19/2025 10:46:50 AM

AI在线

所谓"廉价"的开源AI模型正在吞噬你的算力预算

一项全新的综合研究表明，在执行相同任务时，开源AI模型比闭源竞争对手消耗的计算资源要多得多，这可能会削弱其成本优势，并重塑企业评估AI部署策略的方式。该研究由AI公司Nous Research开展，发现开放权重模型使用的token(AI计算的基本单位)数量是OpenAI和Anthropic等闭源模型的1.5到4倍，对于简单的知识问答，差距会大幅扩大，某些开源模型使用的token数量最多可达闭源模型的10倍。研究人员在周三发布的报告中写道：“开放权重模型使用的token数量是闭源模型的1.5至4倍(对于简单的知识问答，这一差距可达10倍)，因此尽管每个token的成本较低，但每次查询的成本有时反而更高。

8/19/2025 7:07:00 AM

Michae

OpenAI 开源模型被 Meta 研究员“逆改”！只动0.3%参数，gpt-oss-20B 解锁无约束基座

OpenAI在8月初发布了开放权重模型家族gpt-oss，这是公司自2019年GPT-2以来首次真正意义上的开源动作。仅仅两周后，一位研究者就将这一模型“拆解重组”，推出了与官方版本迥异的变体。康奈尔大学博士生、前Google Brain成员、现任Meta研究员的Jack Morris，公开了名为gpt-oss-20b-base的新版本。

8/19/2025 2:10:00 AM

一句话，性能暴涨49%！马里兰MIT等力作：Prompt才是大模型终极武器

AI性能的提升，一半靠模型，一半靠提示词。最近，来自马里兰大学、MIT、斯坦福等机构联手验证，模型升级带来的性能提升仅占50%，而另外一半的提升，在于用户提示词的优化。他们将其称之为「提示词适应」（prompt adaptation）。

8/18/2025 5:20:17 PM

AI版华尔街之狼！o3-mini靠「神之押注」狂赚9倍，DeepSeek R1最特立独行

AI能预测未来吗？在《黑客帝国》里，先知能对Neo的未来做出预测。以ChatGPT为代表的AI，则可以根据过去的语料来「预测下一个Token」。

8/18/2025 5:16:45 PM

OpenAI总裁透露GPT-5改了推理范式，AGI实现要靠现实反馈

OpenAI的AGI之路，总裁Greg Brockman在最新的访谈中说清楚了——技术层面，从文本生成转向强化学习的推理范式，在现实世界中试错并获取反馈；资源策略上，持续投入大规模计算资源；落地环节，把模型封装成Agent，将模型能力打包成为可审计的服务进程。图片这场访谈由AI播客Latent Space主持，与Brockman探讨了OpenAI的AGI的整体技术路线与资源策略。与此同时，OpenAI的落地布局，以及Brockman对未来的思考，也都随着访谈的进行浮出水面。

8/18/2025 5:14:41 PM

量子位

ChatGPT 移动应用收入已突破 20 亿美元，竞争对手远远落后

根据应用情报提供商 Appfigures 的最新分析，自2023年5月推出以来，OpenAI 的 ChatGPT 移动应用在全球消费者支出中已经达到了惊人的20亿美元。这一收入数字是其竞争对手 Claude、Copilot 和 Grok 等的移动端终身消费总和的30倍。图源备注:图片由AI生成，图片授权服务商Midjourney在2025年的这段时间里，ChatGPT 的移动应用已创造了13.5亿美元的收入，而2024年同期的收入仅为1.74亿美元，同比增长高达673%。

8/18/2025 3:31:53 PM

AI在线

从GPT-2到gpt-oss，深度详解OpenAI开放模型的进化之路

众所周知，OpenAI 并不够 Open，不仅研究论文发得越来越少，开源模型也是千呼万唤始出来。其近日发布的两个 gpt-oss 开源模型已经吸引了无数关注，网上也已经出现了不少解读文章或视频。近日，我们熟悉的 Sebastian Raschka 也发布了一篇深度技术博客，对 gpt-oss 进行了详细分析，并回顾了自 GPT-2 以来 AI 社区取得的进步；此外，他还将其与 Qwen 3 进行了比较。

8/18/2025 1:34:00 PM

机器之心

OpenAI ChatGPT 语音模式升级:调速和自定义指令来袭!

近日，OpenAI 对其 ChatGPT 网页应用进行了重大的更新，尤其是在语音模式方面。新增加的 “语音速度” 选项，让用户能够更灵活地调节 ChatGPT 的语音说话速度。用户可以通过一个滑块选择速度，范围从0.5倍速到2.0倍速，满足不同用户的需求。

8/18/2025 10:32:19 AM

AI在线

GPT-5遭用户吐槽 “垃圾”：缩放定律失效，AGI梦渐行渐远？

2025 年 8 月，OpenAI 终于推出备受期待的 GPT-5，但其表现并未如市场预期般带来 “革命性突破”，反而让 “AI 进步失速”“缩放定律失效” 的讨论再度升温。 GPT-5 实测：亮点有限，失望声四起YouTube播主 Mrwhosetheboss 的实测显示，GPT-5 并非全面领先：在创建象棋游戏时优于 . GPT-4o-mini-high，撰写视频脚本时强于 GPT-4o，且能根据任务自动匹配最优模型；但在生成 YouTube .

8/18/2025 9:57:30 AM

资讯热榜

印度创新试点：AI 聊天机器人助力电子商务购物新方式两部门联合发布《政务领域人工智能大模型部署应用指引》大力推动AI技术应用 Sora2公布提示词指南！直接抄作业能玩一整天！ OpenAI新研究称GPT-5为迄今“政治偏见最少”的AI模型软银贷款50亿美元助力AI投资，孙正义押注未来科技！ OpenAI Sora 引爆 App Store“山寨潮”:30万次下载!苹果审核机制遭质疑马斯克 xAI 在孟菲斯开建全球最大污水处理厂，年节约饮用水达 190 亿升前DeepMind大神创业一年估值飙至80亿美元：Reflection AI要做美国版DeepSeek

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画数据机器人大模型 Midjourney 开源 Meta 智能微软用户 AI新词 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练论文代码 LLM 算法芯片 Stable Diffusion 腾讯苹果 AI for Science Claude Agent 蛋白质开发者生成式神经网络 xAI 机器学习 3D 研究人形机器人生成 AI视频百度工具 RAG 大语言模型 Sora 华为 GPU 计算具身智能 AI设计字节跳动搜索大型语言模型 AGI 场景深度学习视频生成架构预测视觉 DeepMind 伟达 Transformer 编程 AI模型神器推荐亚马逊 MCP

文章列表

ACM MM 2025 | 小红书AIGC团队提出风格迁移加速新算法STD

AI绘画史诗级升级！8个案例实测人物一致性新模型Nano Banana

DeepSeek V3.1正式发布:长文档分析、代码理解能力大幅增强，R2仍需等待

奥特曼：我承认GPT-5发布搞砸了

GPT 4o-mini华人领队离开OpenAI：真正推动AI进步不是模型架构，而是互联网

7年了，OpenAI官方给出五代GPT对比，网友却怀念起「狂野」初代

阿里千问踢馆子了！Qwen3新作秒杀ChatGPT，侧脸杀切换第一人称视角，表情包绝绝子，小编：再也不用美图秀秀去水印了

告别人工写脚本！多模态大模型驱动携程UI自动化测试迈入“描述即生成”阶段

小红书发布DynamicFace人脸生成技术，实现高质量图像视频人脸融合

所谓"廉价"的开源AI模型 正在吞噬你的算力预算

OpenAI 开源模型被 Meta 研究员“逆改”！只动0.3%参数，gpt-oss-20B 解锁无约束基座

一句话，性能暴涨49%！马里兰MIT等力作：Prompt才是大模型终极武器

AI版华尔街之狼！o3-mini靠「神之押注」狂赚9倍，DeepSeek R1最特立独行

OpenAI总裁透露GPT-5改了推理范式，AGI实现要靠现实反馈

ChatGPT 移动应用收入已突破 20 亿美元，竞争对手远远落后

从GPT-2到gpt-oss，深度详解OpenAI开放模型的进化之路

​OpenAI ChatGPT 语音模式升级:调速和自定义指令来袭!

GPT-5遭用户吐槽 “垃圾”：缩放定律失效，AGI梦渐行渐远？

所谓"廉价"的开源AI模型正在吞噬你的算力预算

OpenAI ChatGPT 语音模式升级:调速和自定义指令来袭!