AIGC宇宙 AIGC宇宙

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

大家好,我是言川。 最近,一款名为 Nano banana 的神秘图像编辑模型火爆全网,昨晚熬了通宵测试了 100 案例,得出一个结论:它就是目前最强的图像编辑模型,完美解决了 Flux Kontext、GPT-4o 对主体局部修改出现的变形问题。 往期报道:直接上案例,为了测试主体一致性效果,我先用 Midjourney 生成了一张电影风格的角色分镜图。

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

大家好,我是言川。

最近,一款名为 Nano banana 的神秘图像编辑模型火爆全网,昨晚熬了通宵测试了 100+案例,得出一个结论:它就是目前最强的图像编辑模型,完美解决了 Flux Kontext、GPT-4o 对主体局部修改出现的变形问题。

往期报道:

直接上案例,为了测试主体一致性效果,我先用 Midjourney 生成了一张电影风格的角色分镜图。

提示词:The man wearing a white mask stood in the narrow alley of the city. The shot was a frontal medium shot. He quietly gazed ahead, wearing a hooded coat with the sleeves swaying slightly in the wind. The background was a brick wall covered with colorful graffiti. The light entered from the entrance of the alley, illuminating part of the wall. The air was filled with tension and mystery.

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

接着上传图像+提示词指令,让 AI 帮我延展出下个分镜图。

提示词:镜头侧拍,白色面具男子缓缓走过小巷,手轻轻擦过布满涂鸦的砖墙,步伐沉稳。墙壁上的光影随着他的动作变换,巷口尽头透出刺眼的白光,氛围压抑。

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

看这个角色和环境光影效果,一致性保持的非常好。用同样的方式,就可以做出以下分镜图。

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

一张图,一句指令,就能批量产出分镜。

不用训练 Lora,不用折腾复杂参数,这,才是我心目中的降本增效啊......

在这篇文章里,我将带你全面认识这款模型,看看它到底能做到什么。全文包含 30+ 实测案例,覆盖两大核心功能:用嘴改图和用图改图。

一、模型介绍

这款被称作 Nano banana 的模型,早先是只能在 LM Arena 模型测评平台使用,并且没人知道它的来历,非常神秘。

直到最近,谜底揭晓,它是 Google 推出的全新图像编辑模型:Gemini 2.5 Flash Image。

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

官网介绍在这: https://deepmind.google/models/gemini/image/

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

目前官方使用方式有两种(免费使用,但需要网络):

  1. 在 Gemini 中 使用,地址: https://gemini.google.com/
  2. 在 AI Studio 中使用,地址: https://aistudio.google.com/

本篇文章测试的案例是在 AI Studio 中使用的,所以就用它来演示了。

打开“Chat”,在输入框中上传图像和提示词即可。

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

比如,我上传了一张动漫的角色图,然后输入提示词。就可以得到不同场景,但人物保持一致的图像。

提示词:旗袍少女从侧面视角,伸手抚摸一朵盛开的荷花,身体微微前倾,裙摆随风轻轻飘动。场景是池塘边,荷叶与荷花环绕,水面倒映月光。

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

用同样的方式,就可以快速产出一批角色一致性的图像,但这里有几个注意点:

  1. 尺寸控制:提示词控制尺寸并不稳定,建议通过上传参考图来固定(生成图尺寸 = 上传图尺寸)。
  2. 提示词细化:虽然编辑提示词不用写得很复杂,但越具体、越细致,效果往往越好。

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

当然,这个模型也可以多轮对话修改,比如在生成时,发现这张图的灯笼有点莫名其妙,可以输入提示词:“删掉顶部的灯笼”解决。

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

使用方式就是这么朴实无华,下面开始咱们来看一堆实测案例。

二、案例测评

1. 主体一致性

除了前面提到的“通过参考图生成单张分镜图”,Nano banana 还支持一键批量生成分镜图。

比如,我上传了两张人物图:小李子和露丝,让他们再演一次。然后执行的指令是让 AI 基于两张角色图一次性跑出 6 张分镜图。

提示词:使用提供的两张人物参考图(男主和女主),创作一组关于他们的浪漫爱情故事的电影分镜。整体风格为写实浪漫的电影质感,具有柔和光影和浓厚氛围感。请生成 6 张连续的分镜画面,每张画面展示故事的发展过程,从初次相遇、情感逐渐升温,到高潮与结局,保持电影般的叙事连贯性。要求人物形象保持一致,表情和动作随剧情自然变化,展现丰富的情绪与张力。画面构图为横版 16:9,不包含文字,仅保留视觉叙事。

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

展示下它给我生成的过程,除了图像尺寸没按照我说的 16:9 来,整体效果非常好,这也再次验证了:在生成结果中,参考图的影响力往往大于提示词本身。

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

以下是完整的分镜图

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

2. 草图控制

这里分享一个可能会打破大家认知的控图技巧:通过草图控制角色动作。

上传两张角色图,然后我自己手动绘制了一张火柴人打架的草图,再输入提示词,模型就能根据草稿生成对应的图像。

提示词:两名角色按照图三所示的动作展开战斗,背景设置为契合战斗氛围的场景,并加入环境与角色的互动效果。最终画面比例设定为 4:3。

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

接着,我又换了三张不同的参考图,用同样的提示词跑图,角色的一致性依旧保持得非常好。

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

除了简易的火柴人草图,其实还可以通过线稿草绘来精准控制人物动作。

比如,我在网上找了一张“扇脸”的草稿图,结合提示词进行生成,AI 也能顺利跑出画面。只不过,我并没有指定两个角色谁扇谁,它自动给我生成这样的效果(试了好多次)...

AI 似乎能懂人类世界真实发生的场景,这你受得了吗。

提示词:两名角色以图三所示的姿势展开互动,场景背景需与画面氛围相契合,并加入环境与角色的互动效果,画面比例设定为 4:3。

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

震惊我的来了,你可以直接在画面中添加图片和文字注释,让 AI 自动帮你完成合成!

提示词:根据输入图像中的注释,生成完整的画面。请移除文字注释,并将对应位置替换为真实的人物和动物

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

但目前有个问题,就是图像的清晰度不高,估摸着算力太高了,暂时不给我们满血版模型玩。

3. 多图融合

多张图像拼成一张图像的能力比较常见了,主要是看主体的还原度如何。这个部分直接上一个高难度案例,将 5 个动漫角色融合在一张图中。

角色一致性表现得非常好,还训练什么 Lora 模型,一张图就解决了。

提示词:使用提供的五个角色参考图,生成一张星空下篝火场景,画面充满温馨与友情,电影级光影。

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

再来看模特换装,我先上传一张人物图和一张服装图,AI 就能完成换装。

提示词:将这件大衣穿在女模特身上,保持黑白色调

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

再换一整套服装,也没问题。

提示词:使用提供的模特参考图作为基础人物,将提供的整套服装穿在模特身上。

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

这对电商设计师来说绝对是狂喜场景!

我先是用即梦生成了一张模特拿饮料的图片,能看出美年达的影子吧,但瓶子身上的细节很差。不过问题不大,换成我们指定的饮料,几秒钟就搞定了。

提示词:保持模特的姿势和表情不变,将她手中的饮料罐替换为提供红色饮料罐

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

这套工作流真的很丝滑:即梦生成模特 → Nano banana 换指定产品。

提示词:保持模特的手部姿势和蓝天背景不变,将手中拿着的饮料罐替换为提供的红色饮料罐

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

同样,我让即梦生成了一张威士忌渲染图,再用 Nano banana 替换成目标产品,效果依旧完美。

提示词:保持左边威士忌渲染图的背景和环境不变(木质圆木底座、暖色灯光和阴影),将木桩上摆放的酒瓶替换为右图中的威士忌瓶。

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

4. 文本编辑

文本编辑又可以叫做“用嘴改图”,用提示词来修改图像中的物体,这是真的来抢 Phtoshop 的饭碗了。

提示词:将她的服装换成职业西装,背景是办公室场景。

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

提示词:将他的服装换成钢铁侠战衣,保持人物姿势和背景不变。

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

提示词:将背景的 logo 换成 Google。

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

人像修图都能做到,看这个案例,只需一句提示,AI 就能帮人物 剃胡子。

提示词:删掉人物脸上的胡子。

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

还有局部转绘,我用它把一碗写实的拉面转换成插画风格,AI 的意图识别能力真的强到离谱。

提示词:将画面中的拉面和拉面碗转换成具有奇幻感的 2D 手绘动漫插画风格,同时保持图像中其余部分完全不变。

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

最后就是老照片修复,干倒一批靠卖这套 ComfyUI 工作流的老师们。AI 的进化与普惠,优先取代是卖课的(当然也包含我在内)。

提示词:修复这张受损的老照片,去除所有折痕、裂痕、污渍和划痕,补全缺失的细节,提升清晰度,让画面自然完整。在修复的基础上进行彩色化处理:婴儿的肤色柔和自然,毛线帽和毛衣呈现温暖的浅色调,母亲的肤色健康自然,头发为深棕色,衣服保持复古质感。

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

5. 图像转绘

没啥好讲的,上案例,我已经很少打开 Stable Diffusion 了。

提示词:将这张图转换为黑白漫画风格

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

这个手办案例最近很火,提示词我测试下来是通用的,各位拿去玩吧~

提示词:将这张照片转换为一个角色手办。在手办背后放置一个印有该角色图像的包装盒,并在旁边展示一台电脑,屏幕上显示 Blender 建模的制作过程。在包装盒前方放置一个圆形塑料底座,上面站立着角色手办。让 PVC 材质呈现出清晰真实的质感,并尽量将场景设置在室内环境中。

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

6. 物体标注

前段时间 Google 发布了一个世界模型,Nano Banana 应该是集成了这个能力,你可以仅靠一张图像和一句提示词,让它帮你将建筑标注出来,并且写上这个建筑的信息。

不过有个小坑需要注意:Nano Banana 在中文上的生成效果不佳。因此,提示词最好翻译成英文输入,才能得到更理想的结果。

提示词(需翻译):你是一名基于位置的 AR 体验生成器。在这张图像中高亮显示「巴黎圣母院」,并为其添加相关注释信息。

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

提示词(需翻译):你是一名基于位置的 AR 体验生成器。在这张图像中高亮显示「埃菲尔铁塔」,并为其添加相关注释信息。

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

三、写在最后

以上就是本篇文章的全部内容,来唠叨几句。

其实,Nano Banana 这个模型早在 8 月中旬就已经火爆全网了,我一直是有在关注,但没急着写。

因为当时我的想法是:这不就是 GPT-4o、Flux Kontext、豆包 AI 都玩过的“用嘴改图”吗?感觉没啥新鲜的,再加上 LM Arena 上的测试体验很糟糕,我也没怎么深入去玩。

直到最近 Google 官宣了这个事,我才真正去测试,昨晚测了个通宵,真的,太夸张了.......

以前我使用 GPT-4o、Flux Kontext,图像编辑能力确实让我觉得很牛,也就那样。GPT-4o 在编辑时,会将你整张图像进行重绘,在一些不太突出的场景下,还没什么。

但涉及到人像、产品时,一点细微的变形,就让它的商业价值大大降低。

而 Nano Banana,严谨一点,应该叫 Gemini 2.5 Flash Image,它是对局部进行重绘,完全不会影响其他区域,而且它对主体的学习能力太强了,你只需要上传一张清晰的正面图,它可以给你将多角度的图像全部绘制出来。

这意味着什么?

这意味着它直接动了 Stable Diffusion 和 Photoshop 的蛋糕。因为后两者还是有一定学习成本,而在 Gemini 2.5 Flash Image 面前,你只需要一句话、一张图、就能快速得到你想要的图片。

这才是真正具有商业价值的降本增效。

这才是 AI 时代下最使用的生产力工具。

当然,我也想提醒一句:AI 归根结底只是工具。别被 取代 这种说法绑架。哪怕是智能体,也需要人类提出明确的需求。

会用工具,会思考的人,才有真正的价值。

如果你想学习 AIGC,可以加入我主理的《优设 AI 俱乐部》,俱乐部内沉淀有 2000+ 优质 AI 学习资料,涵盖 AI 绘画、AI 视频、AI 提示词、AI 工具库、AI 商业设计案例、研究报告......

也可以点击链接: https://wx.zsxq.com/group/15288828142182

深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)

相关资讯

顶级邪修倾囊相授!8个案例教你速通Nano Banana

大家好,这里是歸藏(guizang),今天教大家如何最大程度发掘最强图片编辑模型 Nano Banana 的潜力。 往期报道:昨晚我们期盼了很久的图像编辑模型终于上线了,大家不再需要从竞技场吭哧瘪肚抽卡,可以爽玩,而且谷歌一如既往的发挥了财大气粗的优势,可以让你疯狂白嫖。 在做了一晚上的通宵测试之后,发现这玩意真的很离谱。
8/29/2025 7:10:31 AM
歸藏

AI绘画史诗级升级!8个案例实测人物一致性新模型Nano Banana

是不是以为我又标题党了。 但是这玩意我觉得真的够强,在我实际工作中也已经用上好几天,所以,体验下来,我是真的觉得对得这个史诗级名号。 这个神秘的AI绘图的新模型,叫做,Nano Banana。
8/20/2025 2:02:08 AM
数字生命卡兹克

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

最近,谷歌一口气对 AI 模型能力做了一次大升级,其中最吸引我的是 Gemini 2.0 Flash (Image Generation) ,这个模型对设计师来说,实用性很强。 更多新模型的介绍:. 被低估的谷歌?
3/26/2025 1:55:56 AM
彩云Sky
  • 1