Nano Banana Pro深度测评！中文字生成和多图融合能力太强了！

大家好，我是言川。凌晨我刚躺下准备睡觉，结果就看到我期待已久的 Nano Banana 2 上线了！记得初代小香蕉上线时也是这种情况，然后就测了一个通宵.......

大家好，我是言川。

凌晨我刚躺下准备睡觉，结果就看到我期待已久的 Nano Banana 2 上线了！

记得初代小香蕉上线时也是这种情况，然后就测了一个通宵......

初代教程：

那没办法，谁让我们有时差呢，起来开始猛测！

Nano Banana Pro深度测评！中文字生成和多图融合能力太强了！

先说说它的命名，Google 最终上线不叫 Nano Banana 2，而是 Nano Banana pro。

一句总结：支持多种尺寸设置，最高能输出 4K 级别的超高分辨率。可以精细地控制图像的多角度、景深焦点、以及色彩。

最最重要的是，也是等了太久的：它终于支持中文文字生成了！

话不多说，直接给大家展示我这一晚上肝出来的实战案例。

一、多文本渲染（支持中文）

以前咱们总说国外模型：生成不了中文，就是差了口气。

这次，Google 彻底把短板补齐了。

Nano Banana Pro 现在支持多国语言，但我这次主要测试的是中文能力，其他语言大家可以自行尝试。

我们先看几个文生图的例子。

提示词：一张平铺的数字手账页，背景是打开的方格笔记本。主题是旅行清单，贴有可爱的卡通男孩的 Q 版贴纸。版面包含剪贴风格的产品照片：一把红伞、一个蓝色水壶、一个暖手宝和一个帆布袋。页面用和纸胶带、回形针和涂鸦装饰。顶部的主标题必须用俏皮的中文字体写着：“小鲁班的旅行清单”。详细的手写中文注释和箭头指向每个产品。

Nano Banana Pro深度测评！中文字生成和多图融合能力太强了！

提示词：一张充满活力与潮流感的孟菲斯风格平面设计海报，采用高饱和度的波普艺术美学和扁平化矢量插画风格。画面主视觉中心是巨大的、夸张变形的白色中文字体设计“喂出来玩”，衬托在不规则的电光蓝几何色块背景之上，具有极强的视觉冲击力。画面右上方漂浮的倾斜紫色标语横幅，上面清晰地写着白色中文字体“不是泛泛之交是饭饭之交”。左下角有醒目的黄色立体气泡文字“Fun!”，右上角漂浮着紫色的标语横幅。画面中散布着趣味十足的装饰元素：一个身穿黄衣蓝裤、手持绿色放大镜正在探视的扁平风格人物，以及一个长着大眼睛的红黄色甜甜圈状吉祥物。周围点缀着星星、笑脸、箭头、唱片和抽象几何形状。整体配色采用克莱因蓝、柠檬黄、玫红和紫色等高对比度色彩，洋溢着年轻、快乐、时尚和探索的氛围，线条利落清晰，无噪点，呈现出高质量的商业插画质感，16:9。

Nano Banana Pro深度测评！中文字生成和多图融合能力太强了！

提示词：潮流酸性波普插画风格，高饱和度荧光色系配色（柠檬绿与电光紫撞色），辅以极简矢量线条与微立体质感，8 个图标以 4×2 阵列整齐排列，每个图标都置于一个独立的 1:1 白色圆角矩形卡片内，这些卡片则悬浮在一个整体的浅灰色背景之上，以拟人化的方形小怪兽为视觉主体，适用于移动端 APP 空状态、缺省页、系统反馈界面。8 个图标具体场景：暂无定位、暂无工作、暂无新帖、暂无评论、网络出错啦、空状态、逛完啦、无法定位；每个图标下方标注对应中文提示，表达生动、造型潮酷、视觉统一，16:9。

Nano Banana Pro深度测评！中文字生成和多图融合能力太强了！

提示词：这是一幅中国风国潮艺术插画，将巨大的中文楷体字“贵阳”设计成了一幅融合城市地标与美食的文化画卷。左侧的“贵”字内部巧妙集成了红色的贵州省博物馆古建筑群、蜿蜒的山脉、祥云和蓝色的波浪纹理，周围环绕着几碗诱人的贵阳特色美食，包括肠旺面、丝娃娃、以及一碗红油米粉。右侧的“阳”字同样以古建筑甲秀楼和文昌阁为核心，背景是青绿山水、翻滚的海浪和祥云，前景是一碗热气腾腾的牛肉粉。整体配色古朴典雅，采用红、绿、蓝、黄等传统色调，具有扁平化插画风格和细腻的纹理质感，背景为纯白色。

Nano Banana Pro深度测评！中文字生成和多图融合能力太强了！

这效果，我还以为是用国内模型生成的，Google 对中文字的生成，真的上大分！

再来个图生图，基于一张写实图片，生成漫画风的分镜脚本图。

提示词：参考图片制作一张黑白漫画分镜脚本，手绘墨线风格，草稿，图像小说。木质写字板背景，胶带固定。四个分镜格，中文手写注释。

Nano Banana Pro深度测评！中文字生成和多图融合能力太强了！

基于它强大的文本渲染能力，你还可以这样玩。

将图片中的外国场景，原地翻译成中文。

提示词：将这张图的场景换成中国某地，保持场景和周边元素完全一致，图中文字需翻译成中文。

Nano Banana Pro深度测评！中文字生成和多图融合能力太强了！

甚至是可以改变产品中的文字。

提示词：保持图中产品和场景不变，将图中饮料瓶身的文字换成中文。

Nano Banana Pro深度测评！中文字生成和多图融合能力太强了！

这次更新在理解世界知识上也有加强。

比如我上传了一张香辣蟹的图像，让它帮我制作食谱流程图。

提示词：帮我制作这张香辣蟹的双页手写食谱剪贴簿，每个步骤都配有照片，照片下方用手写文字简要描述该步骤。陈旧的活页横线纸，中文手写笔迹，照片用胶带固定，包含手绘小元素。

Nano Banana Pro深度测评！中文字生成和多图融合能力太强了！

它就真的懂怎么做的（我做过，差不多的流程），并且还图文并茂。

还可以制作一些理论知识的信息图表，比如勾股定理和光合作用。

提示词：高质量的平面摄影作品，创作一个简单的 DIY 信息图表，解释「勾股定理/光合作用」，排列在干净、浅灰色纹理的背景上。简单的黑色箭头手绘在背景上，引导观众的视线。整体氛围是教育性的、现代的，易于理解。图像采用俯视、鸟瞰视角拍摄，柔和均匀的光线最大限度地减少阴影，使焦点保持在过程上，16:9。

Nano Banana Pro深度测评！中文字生成和多图融合能力太强了！

我上学有这画图的本事也不至于坐在最后一排。

这个世界知识能力，还可以让它识别图中的建筑，并标注出来。

提示词：识别画面中的桥梁主体，并在左上角用白色手绘笔迹写出其对应的中文名称。同时，在画面上叠加一层白色的手绘工程示意图，内容需包含指向桥梁细节的引线说明，以及解释张力和尺寸的技术数据标注。

Nano Banana Pro深度测评！中文字生成和多图融合能力太强了！

这里我让它给我把桥梁的手绘工程示意图也给画出来了，这对真实世界的认知真的强。

二、影视级图像控制

上一代 Nano banana 最大的痛点是分辨率不足，而这一次，它直接飙升到了 4K 超分辨率！

直接将图像生成能力拉到了影视级水准。

这意味着我们可以实现更精细、更专业的镜头控制，玩法很多。

我们先从最基础的景深开始玩起，上传一张前景模糊的图。

提示词：聚焦于人的手部，模糊其面部。

Nano Banana Pro深度测评！中文字生成和多图融合能力太强了！

这细节强的可怕......

反过来再玩下，把前景模糊，后景清晰地表现出来。

提示词：清晰后面两人，模糊前景，将女性人物的画面处理得模糊不清。

Nano Banana Pro深度测评！中文字生成和多图融合能力太强了！

也完全没问题。

再来测试下图像多角度，把特写镜头切换为全景镜头。

提示词：一位男士坐在窗边，人物姿势和场景保持不变，展示人物全景镜头，16:9。

Nano Banana Pro深度测评！中文字生成和多图融合能力太强了！

一致性表现非常好。

再来一组全景镜头切换特写镜头的。

提示词：一辆红色的跑车停在路边，将视角切换至车辆正后方低角度，重点聚焦于圆润饱满的后轮拱线条、精致的红色尾灯内部细节、闪亮的镀铬后保险杠以及排气管。

Nano Banana Pro深度测评！中文字生成和多图融合能力太强了！

不仅切换了视角，还完美理解了正后方低角度这种运镜语言，细节特写质感拉满了。

除了镜头控制，这次升级还对光影控制进行了史诗级加强。

先来一个全局调整，将傍晚夕阳切换为白天。

提示词：切换为白天。

Nano Banana Pro深度测评！中文字生成和多图融合能力太强了！

上面是全局调整，你还可以进行局部光影的精细化控制。

提示词：生成一张具有强烈明暗对比效果的画面。人物应保留其原始特征和表情。引入强烈、方向性的光线，看似从上方略微向左照射，在脸上投下深邃、清晰的阴影。只有少量光线照亮他的眼睛和颧骨，其余脸部处于深暗之中。

Nano Banana Pro深度测评！中文字生成和多图融合能力太强了！

PS 真的可以退休了，啥都可以一句话解决，我还费那劲干嘛......

三、草图参考控制

上一代在上传多张参考图时，最让人头疼的就是素材会被吞掉。

Google 针对多图输入和融合又做了优化，我们直接上难度，挑战它的极限！

我一次性上传了 5 张参考图，让它给我用作于一张图上做融合。

提示词：将这些图片整合成一张格式为 9:16 的、布局恰当的图片，并将模特身上的服装更换为图片中的服装和包。

Nano Banana Pro深度测评！中文字生成和多图融合能力太强了！

处理的细节完全没问题，服装材质、包包款式，甚至连细小的参考图信息都完全一致。

做品牌 LOGO 设计也不在话下，只需要上传风格参考图，便可将草图一键渲染上色，省去手动上色的时间。

提示词：将右边的草图渲染成左边的参考图风格。

Nano Banana Pro深度测评！中文字生成和多图融合能力太强了！

它还可以支持批量生图。

比如我通过一句提示词，让它帮我生成 4 张周边物料图。

提示词：根据这张 LOGO 图，创建咖啡杯、帆布包、T 恤、广告牌四张图像，每张图尺寸为 16:9。

Nano Banana Pro深度测评！中文字生成和多图融合能力太强了！

再来个参考风格生图。

提示词：将这幅简单的草图转化为一个逼真的椅子，遵循草图的创意方向，并运用汽车图片中的颜色和纹理。

Nano Banana Pro深度测评！中文字生成和多图融合能力太强了！

打败 AI 的只有更强大的 AI，再见，SD。

再来测试下多主体一致性。

这部分我加大点压力，选择上传两张图片，包含 7 人人物，看看它的融合能力如何。

提示词：将这两张图片中的人物放在一个室外场景中，双方在微笑交谈，保持人物的身份、服装和风格不变，但可以改变人物的动作，16:9。

Nano Banana Pro深度测评！中文字生成和多图融合能力太强了！

好家伙，我是真服了，一次生成，没抽卡......

再来一组，直接扔给他 12 张参考图，就给我可劲造吧。

提示词：一个中景画面，12 个毛茸茸的角色挤在一起，并排坐在宽大的木质长椅上和长椅前的鹅卵石地面上。他们都面向前方，看着放在长椅前低矮石桌上的复古手摇留声机。房间光线昏暗，右侧的篝火透进温暖的光线，留声机发出的微光照亮了生物的面庞和毛茸茸的质感。背景是一个舒适、略显杂乱的森林营地，有铺着松针的地面、摆满野营工具和食物的木箱，以及背景中简易的帐篷和远处的树林。整体氛围温暖、舒适且充满趣味，16:9。

Nano Banana Pro深度测评！中文字生成和多图融合能力太强了！