
大家好,我是言川。
凌晨我刚躺下准备睡觉,结果就看到我期待已久的 Nano Banana 2 上线了!
记得初代小香蕉上线时也是这种情况,然后就测了一个通宵......
初代教程:
那没办法,谁让我们有时差呢,起来开始猛测!

先说说它的命名,Google 最终上线不叫 Nano Banana 2,而是 Nano Banana pro。
一句总结:支持多种尺寸设置,最高能输出 4K 级别的超高分辨率。可以精细地控制图像的多角度、景深焦点、以及色彩。
最最重要的是,也是等了太久的:它终于支持中文文字生成了!
话不多说,直接给大家展示我这一晚上肝出来的实战案例。
一、多文本渲染(支持中文)
以前咱们总说国外模型:生成不了中文,就是差了口气。
这次,Google 彻底把短板补齐了。
Nano Banana Pro 现在支持多国语言,但我这次主要测试的是中文能力,其他语言大家可以自行尝试。
我们先看几个文生图的例子。
提示词:一张平铺的数字手账页,背景是打开的方格笔记本。主题是旅行清单,贴有可爱的卡通男孩的 Q 版贴纸。版面包含剪贴风格的产品照片:一把红伞、一个蓝色水壶、一个暖手宝和一个帆布袋。页面用和纸胶带、回形针和涂鸦装饰。顶部的主标题必须用俏皮的中文字体写着:“小鲁班的旅行清单”。详细的手写中文注释和箭头指向每个产品。

提示词:一张充满活力与潮流感的孟菲斯风格平面设计海报,采用高饱和度的波普艺术美学和扁平化矢量插画风格。画面主视觉中心是巨大的、夸张变形的白色中文字体设计“喂出来玩”,衬托在不规则的电光蓝几何色块背景之上,具有极强的视觉冲击力。画面右上方漂浮的倾斜紫色标语横幅,上面清晰地写着白色中文字体“不是泛泛之交 是饭饭之交”。左下角有醒目的黄色立体气泡文字“Fun!”,右上角漂浮着紫色的标语横幅。画面中散布着趣味十足的装饰元素:一个身穿黄衣蓝裤、手持绿色放大镜正在探视的扁平风格人物,以及一个长着大眼睛的红黄色甜甜圈状吉祥物。周围点缀着星星、笑脸、箭头、唱片和抽象几何形状。整体配色采用克莱因蓝、柠檬黄、玫红和紫色等高对比度色彩,洋溢着年轻、快乐、时尚和探索的氛围,线条利落清晰,无噪点,呈现出高质量的商业插画质感,16:9。

提示词:潮流酸性波普插画风格,高饱和度荧光色系配色(柠檬绿与电光紫撞色),辅以极简矢量线条与微立体质感,8 个图标以 4×2 阵列整齐排列,每个图标都置于一个独立的 1:1 白色圆角矩形卡片内,这些卡片则悬浮在一个整体的浅灰色背景之上,以拟人化的方形小怪兽为视觉主体,适用于移动端 APP 空状态、缺省页、系统反馈界面。8 个图标具体场景:暂无定位、暂无工作、暂无新帖、暂无评论、网络出错啦、空状态、逛完啦、无法定位;每个图标下方标注对应中文提示,表达生动、造型潮酷、视觉统一,16:9。

提示词:这是一幅中国风国潮艺术插画,将巨大的中文楷体字“贵阳”设计成了一幅融合城市地标与美食的文化画卷。左侧的“贵”字内部巧妙集成了红色的贵州省博物馆古建筑群、蜿蜒的山脉、祥云和蓝色的波浪纹理,周围环绕着几碗诱人的贵阳特色美食,包括肠旺面、丝娃娃、以及一碗红油米粉。右侧的“阳”字同样以古建筑甲秀楼和文昌阁为核心,背景是青绿山水、翻滚的海浪和祥云,前景是一碗热气腾腾的牛肉粉。整体配色古朴典雅,采用红、绿、蓝、黄等传统色调,具有扁平化插画风格和细腻的纹理质感,背景为纯白色。

这效果,我还以为是用国内模型生成的,Google 对中文字的生成,真的上大分!
再来个图生图,基于一张写实图片,生成漫画风的分镜脚本图。
提示词:参考图片制作一张黑白漫画分镜脚本,手绘墨线风格,草稿,图像小说。木质写字板背景,胶带固定。四个分镜格,中文手写注释。

基于它强大的文本渲染能力,你还可以这样玩。
将图片中的外国场景,原地翻译成中文。
提示词:将这张图的场景换成中国某地,保持场景和周边元素完全一致,图中文字需翻译成中文。

甚至是可以改变产品中的文字。
提示词:保持图中产品和场景不变,将图中饮料瓶身的文字换成中文。

这次更新在理解世界知识上也有加强。
比如我上传了一张香辣蟹的图像,让它帮我制作食谱流程图。
提示词:帮我制作这张香辣蟹的双页手写食谱剪贴簿,每个步骤都配有照片,照片下方用手写文字简要描述该步骤。陈旧的活页横线纸,中文手写笔迹,照片用胶带固定,包含手绘小元素。

它就真的懂怎么做的(我做过,差不多的流程),并且还图文并茂。
还可以制作一些理论知识的信息图表,比如勾股定理和光合作用。
提示词:高质量的平面摄影作品,创作一个简单的 DIY 信息图表,解释「勾股定理/光合作用」,排列在干净、浅灰色纹理的背景上。简单的黑色箭头手绘在背景上,引导观众的视线。整体氛围是教育性的、现代的,易于理解。图像采用俯视、鸟瞰视角拍摄,柔和均匀的光线最大限度地减少阴影,使焦点保持在过程上,16:9。

我上学有这画图的本事也不至于坐在最后一排。
这个世界知识能力,还可以让它识别图中的建筑,并标注出来。
提示词:识别画面中的桥梁主体,并在左上角用白色手绘笔迹写出其对应的中文名称。同时,在画面上叠加一层白色的手绘工程示意图,内容需包含指向桥梁细节的引线说明,以及解释张力和尺寸的技术数据标注。

这里我让它给我把桥梁的手绘工程示意图也给画出来了,这对真实世界的认知真的强。
二、影视级图像控制
上一代 Nano banana 最大的痛点是分辨率不足,而这一次,它直接飙升到了 4K 超分辨率!
直接将图像生成能力拉到了影视级水准。
这意味着我们可以实现更精细、更专业的镜头控制,玩法很多。
我们先从最基础的景深开始玩起,上传一张前景模糊的图。
提示词:聚焦于人的手部,模糊其面部。

这细节强的可怕......
反过来再玩下,把前景模糊,后景清晰地表现出来。
提示词:清晰后面两人,模糊前景,将女性人物的画面处理得模糊不清。

也完全没问题。
再来测试下图像多角度,把特写镜头切换为全景镜头。
提示词:一位男士坐在窗边,人物姿势和场景保持不变,展示人物全景镜头,16:9。

一致性表现非常好。
再来一组全景镜头切换特写镜头的。
提示词:一辆红色的跑车停在路边,将视角切换至车辆正后方低角度,重点聚焦于圆润饱满的后轮拱线条、精致的红色尾灯内部细节、闪亮的镀铬后保险杠以及排气管。

不仅切换了视角,还完美理解了正后方低角度这种运镜语言,细节特写质感拉满了。
除了镜头控制,这次升级还对光影控制进行了史诗级加强。
先来一个全局调整,将傍晚夕阳切换为白天。
提示词:切换为白天。

上面是全局调整,你还可以进行局部光影的精细化控制。
提示词:生成一张具有强烈明暗对比效果的画面。人物应保留其原始特征和表情。引入强烈、方向性的光线,看似从上方略微向左照射,在脸上投下深邃、清晰的阴影。只有少量光线照亮他的眼睛和颧骨,其余脸部处于深暗之中。

PS 真的可以退休了,啥都可以一句话解决,我还费那劲干嘛......
三、草图参考控制
上一代在上传多张参考图时,最让人头疼的就是素材会被吞掉。
Google 针对多图输入和融合又做了优化,我们直接上难度,挑战它的极限!
我一次性上传了 5 张参考图,让它给我用作于一张图上做融合。
提示词:将这些图片整合成一张格式为 9:16 的、布局恰当的图片,并将模特身上的服装更换为图片中的服装和包。

处理的细节完全没问题,服装材质、包包款式,甚至连细小的参考图信息都完全一致。
做品牌 LOGO 设计也不在话下,只需要上传风格参考图,便可将草图一键渲染上色,省去手动上色的时间。
提示词:将右边的草图渲染成左边的参考图风格。

它还可以支持批量生图。
比如我通过一句提示词,让它帮我生成 4 张周边物料图。
提示词:根据这张 LOGO 图,创建咖啡杯、帆布包、T 恤、广告牌四张图像,每张图尺寸为 16:9。

再来个参考风格生图。
提示词:将这幅简单的草图转化为一个逼真的椅子,遵循草图的创意方向,并运用汽车图片中的颜色和纹理。

打败 AI 的只有更强大的 AI,再见,SD。
再来测试下多主体一致性。
这部分我加大点压力,选择上传两张图片,包含 7 人人物,看看它的融合能力如何。
提示词:将这两张图片中的人物放在一个室外场景中,双方在微笑交谈,保持人物的身份、服装和风格不变,但可以改变人物的动作,16:9。

好家伙,我是真服了,一次生成,没抽卡......
再来一组,直接扔给他 12 张参考图,就给我可劲造吧。
提示词:一个中景画面,12 个毛茸茸的角色挤在一起,并排坐在宽大的木质长椅上和长椅前的鹅卵石地面上。他们都面向前方,看着放在长椅前低矮石桌上的复古手摇留声机。房间光线昏暗,右侧的篝火透进温暖的光线,留声机发出的微光照亮了生物的面庞和毛茸茸的质感。背景是一个舒适、略显杂乱的森林营地,有铺着松针的地面、摆满野营工具和食物的木箱,以及背景中简易的帐篷和远处的树林。整体氛围温暖、舒适且充满趣味,16:9。

最后
我们来个反向操作。
上传一张图,让它一次性给我生成 10 个相同主体,但不同场景的分镜图。
提示词:著名的公共领域儿童电影,采用提供的风格和相同的配色方案。共 10 个画面,一个接一个地生成。不要文字。不要生成单个连环画,而是生成 10 个画面,每个画面单独使用一个提示词生成。每个画面为横向 16:9 比例。

得了,Google 这次真的把设计、图像生成领域的桌子给掀了。
几乎几乎,你能想到的所有图像生成、图像编辑场景,它都能给你解决。
以前它不能生成中文字,现在能了。
以前它生成的图像分辨率低,现在直接给你 4K 超分辨率!
以前角色一致性还缺点意思,现在你上传 7-8 个人物、10+ 张图片,都能给你融合的明明白白。
这哪是设计师接受不了,老牌的图像模型看到都要泪奔了。
行了,废话就不多说了,今晚熬个通宵,值得!
目前登录 Gemini 就能使用了。地址在这: https://gemini.google.com/

如果上不去,用 Lovart AI 也可以,订阅会员好像还是免费用,我跑了几个案例没花积分。

另外测试的比较早,还有许多好玩的场景没来得及挖掘,之后再给大家分享。
最后希望本篇文章对大家有所帮助!
如果你想学习 AIGC,可以加入我主理的《优设 AI 俱乐部》,俱乐部内沉淀有 2000+ 优质 AI 学习资料,涵盖 AI 绘画、AI 视频、AI 提示词、AI 工具库、AI 商业设计案例、研究报告......
也可以点击链接: https://wx.zsxq.com/group/15288828142182
、