AIGC宇宙 AIGC宇宙

终结AI图像“变脸”噩梦:OpenAI推出GPT Image1.5,主打精准编辑与视觉一致性

OpenAI 正在推出新一代图像生成模型 GPT Image1.5,以抗衡谷歌在人工智能领域的强势崛起。 据 AIbase 报道,这款新模型承诺带来显著的性能提升,包括更精确的指令遵循、更细致的编辑控制以及高达四倍的图像生成速度。  速度与精度升级:GPT Image1.5全面对抗谷歌GPT Image1.5已于本周二面向所有 ChatGPT 用户和 API 用户开放。

OpenAI 正在推出新一代图像生成模型 GPT Image1.5,以抗衡谷歌在人工智能领域的强势崛起。据 AIbase 报道,这款新模型承诺带来显著的性能提升,包括更精确的指令遵循、更细致的编辑控制以及高达四倍的图像生成速度

 速度与精度升级:GPT Image1.5全面对抗谷歌

GPT Image1.5已于本周二面向所有 ChatGPT 用户和 API 用户开放。此次更新是在 OpenAI 首席执行官 Sam Altman 宣布进入“红色警戒”状态后,为重夺人工智能领导地位而采取的最新战略举措。

此前,谷歌发布的旗舰模型 Gemini3 及其病毒式图像生成器 Nano Banana Pro 表现强劲,在 LMArena 排行榜上名列前茅,并开始蚕食市场份额。尽管 OpenAI 上周推出了其声称“迄今为止最先进”的模型 GPT-5.2,谷歌仍保持着领先地位。据报道,OpenAI 原计划在1月初发布新的图像生成器,但为了应对竞争,此次发布计划被加速

QQ20251217-084853.png

 媲美后期制作:解决 GenAI 图像一致性难题

GPT Image1.5是继4月份发布的 GPT Image1之后的又一迭代,它将图像生成器从原型阶段推向更具生产力的功能。新模型特别强调了后期制作功能,与 Nano Banana Pro 类似,它能提供更精细的编辑控制,从而在编辑过程中保持关键的视觉一致性(如面部相似度、光照、构图和色调)。

这对 GenAI 图像工具而言是一个重大进步。OpenAI 特别指出,大多数现有工具在迭代编辑方面表现不佳,例如当用户要求“调整面部表情”或“使光线更冷”时,模型往往会重新解释整张图像,导致结果不一致。GPT Image1.5旨在解决这一指令跟随难题。

 整合“创意工作室”与视觉体验优化

OpenAI 应用首席执行官 Fidji Simo 在一篇博客文章中透露,ChatGPT 现已通过侧边栏提供 “更像是一个创意工作室”的专用入口来访问图片功能。新的图像查看和编辑界面旨在让用户更容易创作出符合其想法的图像,或从热门提示和预设滤镜中获得灵感。

除了新的图像生成器,OpenAI 还计划通过引入更多视觉元素来改进 ChatGPT 的整体使用体验。Simo 表示,未来的搜索查询将显示更多带有清晰来源的视觉元素,这对于单位换算或查看体育比分等任务将非常有用。

Simo 总结道:“当你脑海中的想法与你将其变为现实的能力之间的差距不断缩小,我们才能更好地为你服务。”

相关资讯

OpenAI低调更新GPT4o模型,多项能力反超DeepSeek

近日,OpenAI 对其 ChatGPT 的 GPT4o 模型进行了更新,这一消息由 OpenAI 的首席执行官 Sam Altman 在社交平台 X 上透露。 Altman 表示,此次更新是在上个周末进行的,旨在进一步提升用户的使用体验。 他强调,新版本的模型在使用过程中表现出色,给用户带来了更为顺畅的体验。
2/18/2025 10:18:00 AM
AI在线

自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言

围绕 DeepSeek 的谣言实在太多了。 面对 DeepSeek R1 这个似乎「一夜之间」出现的先进大模型,全世界已经陷入了没日没夜的大讨论。 从它的模型能力是否真的先进,到是不是真的只用了 550W 进行训练,再到神秘的研究团队,每个角度都是话题。
2/5/2025 2:37:00 PM
机器之心

程序员购买OGOpenAI.com域名转向DeepSeek

最近,一名软件工程师以 “不到一顿 Chipotle 餐的价格” 购买了 OGOpenAI.com 域名,并将其重定向至中国人工智能实验室 DeepSeek 的网站。 该实验室在开源 AI 领域崭露头角,吸引了广泛的关注。 据软件工程师阿纳奈・阿罗拉(Ananay Arora)向《TechCrunch》透露,他的初衷是为了支持 DeepSeek,因为该实验室最近推出了一款名为 DeepSeek-R1的开放版本模型,声称在某些基准测试中表现优于 OpenAI 的 o1。
1/23/2025 4:32:00 PM
AI在线
testab