AIGC宇宙 AIGC宇宙

OpenAI推出全新图像生成模型,挑战Google一句话P图

作者:AI在线
2025-03-26 09:48
在科技界的最新动态中,OpenAI 刚刚宣布,他们在最新的 GPT-4o 模型中集成了迄今为止最先进的图像生成器。 OpenAI 的首席执行官萨姆・奥特曼(Sam Altman)在社交媒体平台 X 上兴奋地分享了他第一次看到模型生成的图像时的震惊,认为这简直难以置信,并期待用户们充分发挥他们的创造力。 新功能的亮点包括:- 能够精确渲染文本内容,提供高质量的图像效果。

在科技界的最新动态中,OpenAI 刚刚宣布,他们在最新的 GPT-4o 模型中集成了迄今为止最先进的图像生成器。OpenAI 的首席执行官萨姆・奥特曼(Sam Altman)在社交媒体平台 X 上兴奋地分享了他第一次看到模型生成的图像时的震惊,认为这简直难以置信,并期待用户们充分发挥他们的创造力。

image.png

新功能的亮点包括:

- 能够精确渲染文本内容,提供高质量的图像效果。

- 支持多种输入输出方式,涵盖文本、图像和音频等多种形式。

- 理解复杂指令并结合上下文,创造出具有真实感的第一人称视角图像。

与之前的图像生成模型 DALL・E 不同,GPT-4o 采用了一种自回归模型,原生嵌入在 ChatGPT 中。这意味着,它能够处理多达10至20个不同物体的复杂指令,而竞争对手通常只能处理5至8个,展现出更强的能力。

image.png

用户只需简洁地描述需求,比如指定纵横比、颜色或透明背景,模型便可以快速生成图像。虽然渲染较复杂的细节可能需要稍等一会儿,但最终的效果是值得的。

在一次发布会上,演示者展示了多个具体案例。比如,他将一张合影转化为动漫风格的图像,模型不仅成功保留了人物的特征,还完美融合了动漫视觉效果。此外,演示者要求生成一页关于相对论的幽默漫画,结果生成的漫画不仅结构完整,还生动有趣。

OpenAI 对此功能的安全性也非常重视,所有生成的图像都带有 C2PA 元数据标识,确保内容的来源可追溯,并有效阻止不当请求的生成。

当然,OpenAI 的图像生成工具并非没有缺点,比如在裁剪、上下文理解和非拉丁文本渲染等方面仍存在不足。不过,OpenAI 表示他们会在未来不断优化这些问题。

与此同时,Google 也在同一时间发布了自家的强大 AI 模型 Gemini2.5Pro Experimental,展现出在推理和编程能力上的显著提升。这一系列的动态显示出,AI 领域的竞争愈发激烈,各大科技巨头都在不断推出更先进的技术,力争在这场 “AI 争霸战” 中占据领先地位。

相关资讯

AI"自我对抗"玩法火了 一句话让AI破防

最近,一场别开生面的AI对决正在互联网上演。 从唇枪舌战到国际象棋对弈,AI之间的较量不仅展现了它们的语言能力和思维方式,更成为当下最热门的流量话题。 近期,DeepSeek与GPT的对话视频在B站引发广泛关注,播放量突破300万,互动量超50万。
2/11/2025 5:57:00 PM
AI在线

人刚毕业,代码一点不会,他纯靠ChatGPT写APP,年入千万美金

第一个App年入50万,第二个年入500万,第三个月入100万。 我不会编程,却在两年时间内靠 ChatGPT 写代码做 APP,年入千万美金。 没开玩笑,这不是拼好饭吃多了的最终幻想,而是现实生活中上演的真人真事。
2/23/2025 5:33:00 PM
机器之心

AI “狼人杀” 大战!GPT-4.5 封神:社交推理 + 顶级欺骗,把 Claude 和 DeepSeek 都 “玩弄于股掌”!

万万没想到,AI 不仅能在棋盘上 “厮杀”,在 “狼人杀” 这种尔虞我诈的社交游戏中,也展现出了惊人的智力! 最近,一场代号为 “Elimination Game” 的 AI “狼人杀” 基准测试火爆出炉, 结果简直让人 “虎躯一震”: GPT-4.5竟然在这场 “社交博弈” 中 “封神”, 把 Claude3.7Sonnet 和 DeepSeek R1等一众 AI “大佬” 都远远甩在了身后! 这不禁让人惊呼: AI 的 “社交智能” 已经进化到如此恐怖的程度了吗?这场 “Elimination Game” 的规则听起来就 “心跳加速”: 最多8名玩家(可以是 AI 模型,也可以是真人玩家) 被拉入 “战场”, 每轮都要 “票决” 淘汰一人, 直到只剩下最后两名 “幸存者”。
3/4/2025 10:56:00 AM
AI在线
  • 1