Midjourney + Nano Banana Pro：修正 AI 图像弱点的双工具流程

Midjourney 掌管美感，Nano Banana Pro 掌管文字与身份。这是修正 AI 图像弱点的双工具流程，附可复制贴上的提示序列。

实用攻略

2026-06-03

为什么 2026 年单靠一个图像工具永远不够

不妨做一个测试。把你上周用 Midjourney 生成的任何一张产品图拿出来，要求它在顶部加上一句拼写正确、干净利落的标题。你会看到那些字母融化成一堆乱码。

再换一张图，要求 Midjourney 在五个不同场景中保持同一个模特儿的脸孔。到了第三张，那张脸已经悄悄变成另一个陌生人。

这些都不是你的操作失误，而是 Midjourney 一直以来的两个弱点：清晰的文字，以及锁定的人物身份。解决方法不是写一条更好的提示，而是引入第二个专门为这两件事而设的工具。

这个第二工具就是 Google 的图像模型 Nano Banana Pro。两者搭配使用，正好互相补足对方的盲点。本文会告诉你明确的分工方式，以及一套你今天就能上手的流程。

什么是 Nano Banana Pro？它与 Midjourney 有何分别？

Nano Banana Pro 是 Gemini 3 Pro Image 的外号，由 Google DeepMind 于 2025 年 11 月 20 日推出的图像生成与编辑模型。它专为 Midjourney 不擅长的两件事而设：在图像内呈现准确文字，以及在多次编辑中保持人物身份一致。

两者的分别不在于「谁更强」，而在于「谁为了什么而设」。2025 年 4 月推出的 Midjourney V7 至今仍是美感最强的模型，掌管光影、氛围、构图，以及那种难以言喻的品味。

Nano Banana Pro 则是精准引擎。根据 Google DeepMind 的模型页面，它能在多达 14 张输入图像之间保持身份一致，并在一个复杂场景中让多达 5 个人物维持可辨识。它亦能在图像内直接呈现清晰文字，并支援多种语言。

你可以把它想像成一个摄制组。Midjourney 是掌管整体质感的摄影指导，Nano Banana Pro 则是负责修图与标题设计的后期师，掌管那些让画面真正可用的细节。

核心流程：在 Midjourney 生成，在 Nano Banana Pro 收尾

可靠的流程是一次两阶段交接：先在 Midjourney 建立美感，再把图像交给 Nano Banana Pro 修文字、锁身份或合成元素。你既保留 Midjourney 的质感，又获得 Nano Banana Pro 的精准。

第一阶段是生成。你向 Midjourney 描述想要的氛围、色调与构图，这个阶段完全不理会文字和细节。你唯一的目标，是得到一张感觉对味的底图。

第二阶段是编辑。你把那张 Midjourney 图像上传到 Nano Banana Pro，再用自然语言下指令：加上这句标题、换掉这个背景、保留这张脸、把产品放在货架上。它是在既有像素上编辑，而不是从头重画。

这次交接之所以重要，是因为「重新生成」正是一致性的敌人。每次你要求模型「再试一次」，都是在赌你原本已经满意的部分。编辑既有图像，才能保护你已经通过的成果。

如何让人物或产品在不同图像中保持一致？

要保持主体一致，先生成主体一次，再利用 Nano Banana Pro 的多图输入功能，把这个完全相同的主体带进每一个新场景。你提供参考图加上新指令，它会保留身份，而不是另造一个新的。

这是实战者最大的突破。一个单打独斗的营销人，现在可以打造一个固定出现的品牌吉祥物、一位形象一致的代言人，或一件在整个推广活动中外观完全相同的产品，全程不需要拍摄。

实际操作很简单。先在 Midjourney 反覆生成你的主视觉，直到脸孔或产品完全准确，然后储存。接着在 Nano Banana Pro 附上那张图，描述你想把同一主体放进的新场景。

由于这个模型一次可参考多达 14 张图像，你还可以分别交给它一张脸、一件产品和一个背景，要求它融合成一张连贯的画面。这正是单靠 Midjourney 无法稳定做到的部分。

立即试试：一套完整的双工具提示序列

以下是一段可直接复制贴上的序列，针对一个常见任务：一则社交广告，需要形象一致的代言人，以及一句干净、拼写正确的标题。第一条提示在 Midjourney 执行，第二条在 Nano Banana Pro 执行。

第一步，在 Midjourney（只做美感，不加文字）：

Editorial portrait of a confident Hong Kong woman in her early 30s, smart-casual blazer, sitting in a bright modern co-working space, warm natural window light, shallow depth of field, professional advertising photography, 4:5 vertical composition

第二步，在 Nano Banana Pro（附上 Midjourney 图像）：

Using the attached image as the exact reference for the woman's face and outfit, keep her identity identical. Place a clean headline in the upper third that reads "Work smarter, not harder" in bold white sans-serif text. Keep the lighting and background unchanged. Output a crisp, legible, print-ready result.

之后重复使用第二步，配上新场景和同一张参考图，就能建立一整套代言人从不改变的推广活动。

会破坏双工具流程的常见错误

最常见的失误是次序颠倒：先在 Midjourney 尝试修文字或人物，再把一张已经坏掉的图汇入 Nano Banana Pro。每一次都应该先生成质感，后做编辑。

第二个错误是在 Nano Banana Pro 描述过度。Midjourney 喜欢冗长堆叠的修饰词，Nano Banana Pro 则偏好更少、更清晰的指令。如果你把一条 40 字的 Midjourney 提示直接贴进去，结果只会一团糟。

第三个错误是重新生成而非编辑。一旦 Nano Banana Pro 给了你一张不错的底图，就用后续指令继续编辑同一张图，不要重新生成，否则会丢掉你已经锁定的身份。

诚实地说一个限制：两个工具对于细小的反光文字、密集的段落，或极端姿势下的手部，都未必完美。发布前务必放大至 100% 并校对图中文字。Nano Banana Pro 在这方面远胜 Midjourney，但仍非万无一失。

让它真正落地，省去反覆试错

这套双工具流程的重点，其实不在软件，而在于把每个工具用在它被设计来做的事情上，而不是强迫一个模型包办一切，失败时再怪自己的提示写得不好。

一旦想通这一点，你的产出就不再是抽奖。你会得到想要的质感、真正能用的文字，以及一张在整个推广活动中始终如一的脸孔或产品。这就是「用 AI 图像」与「真正交付 AI 图像」之间的分别。

在 UD，我们协助香港团队把一次性的 AI 实验，变成可重复的生产流程；我们会手把手带你完成每一步，从工具设定到一套你整个团队都能运行的系统。

懂AI的冷，更懂你的难 — UD 同行28年，让科技成为有温度的陪伴。

打造可投产的 AI 图像工作流程

UD 以 28 年经验，协助香港企业把新技术变成实际成果。
掌握了这套双工具技术后，下一步是把它整合成一个团队每次都能稳定运行的流程。UD 团队手把手带你完成每一步，从工具配置、流程设计，到实际部署。

探索 AI Battle Staff

其他人也看了

AI 与个人资料条例：香港企业领袖必须掌握的事什么是 RAG？企业 AI 准确性的关键框架如何在 n8n 搭建 AI 代理：完全不用写代码 Perplexity 200 美元 AI 邮件代理是什么？老板实用解读什么是 Claude for Small Business？香港中小企老板的入门指南

UD Blog

专业文章及见解，揭示科技领域的一切

Midjourney + Nano Banana Pro：修正 AI 图像弱点的双工具流程

Midjourney 掌管美感，Nano Banana Pro 掌管文字与身份。这是修正 AI 图像弱点的双工具流程，附可复制贴上的提示序列。

为什么 2026 年单靠一个图像工具永远不够

什么是 Nano Banana Pro？它与 Midjourney 有何分别？

核心流程：在 Midjourney 生成，在 Nano Banana Pro 收尾

如何让人物或产品在不同图像中保持一致？

立即试试：一套完整的双工具提示序列

会破坏双工具流程的常见错误

让它真正落地，省去反覆试错

打造可投产的 AI 图像工作流程

其他人也看了

UD Blockchain 通讯