1. 官方图像提示词指南
本章节参考官方提示词指南编写:
Nano Banana
Nano Banana 基于 Google Gemini 2.5 Flash,主打快速、稳定的通用生成,适合探索阶段使用。它的图中文字渲染能力在同类中表现突出,多次生成之间的角色与风格一致性也较为稳定,支持最多 8 张参考图、10 种宽高比,单图分辨率上限约为 1 兆像素(1024×1024)。需要 4K 输出时应改用 Nano Banana Pro。
提示词建议控制在 100 词以内,超出部分应紧扣镜头、光线或动作,否则画质容易下降。描述清楚风格、构图和关键元素即可,避免使用列表、JSON 或代码格式——相比冗长的铺陈,该模型对清晰、聚焦的提示词响应更好。
提示词模板:
示例:
要点提示:生成知名人物时必须提供参考图,仅凭文字难以还原可辨识的样貌;如果风格偏"平淡通用",可改用 Seedream;图中文字渲染是它的强项,适合海报、招牌、包装类设计。
Nano Banana Pro
Nano Banana Pro 是 Google Gemini 的高阶版本,定位为专业创作的常备主力:画质更高,分辨率最高可控制到 4K,足以满足面向客户的交付和营销项目。它提供 1K(快速)、2K(均衡)、4K(最高质量)三档分辨率,支持最多 14 张参考图和 10 种宽高比,在照片级写实和产品成像方面尤为出色。
提示词策略与 Nano Banana 一致,关键在于简洁清晰;产品和品牌类任务则需要补充纹理、材质和配色等细节。使用多张参考图时,要逐张标明各自的角色和类型。
提示词模板:
示例:
要点提示:草稿迭代用 1K,定稿用 2K,仅在需要印刷级质量时用 4K;如果艺术风格效果偏平淡,可切换到 Seedream;连续多次编辑会导致画质衰减,可在每次编辑之间做一次放大,或在多轮编辑满意后,将所有改动一次性应用到原图。
Seedream
Seedream 5.0 由字节跳动开发,专门应对小众艺术风格和高度风格化的创作。当 Nano Banana 给出的结果偏"平淡通用"时,它就是更好的选择。它尤其擅长复古动画(如《吸血鬼猎人 D》《Hellsing》以及 80/90 年代动画美学)和各类冷门艺术流派,对复杂、详尽的长提示词的遵循度也高于其他模型。它提供 1K/2K/4K 三档分辨率,支持最多 6 张参考图和 9 种宽高比(含 9:21 超长竖幅)。
5.0 被定位为"意图驱动"的升级版本,能更好地理解自然语言指令。虽然没有公布明确的字数上限,但开发文档建议提示词控制在约 600 个英文单词以内。使用时的关键是精准描述目标风格——指明具体的视觉参照、年代和艺术流派,并补充线条粗细、配色、明暗处理等技术细节。
提示词模板:
示例:
要点提示:当 Nano Banana 在艺术风格上表现平淡时再启用它;混用写实与插画类线索容易导致风格错乱,需要谨慎;明确指出目标动画年代或艺术流派可获得更好的效果;提示词的风格指向越具体,结果越精准。
GPT Image 1.5
GPT Image 1.5 由 OpenAI 开发,适合需要严格控制和复杂多图合成的场景,同时提供低质量档位,便于在动用重型模型之前做快速、低成本的试错。它在复杂的多图编辑与合成上表现出色,能够基于多张参考图构建出新颖的视角和复杂的构图变化,对输入图的风格、构图和细节保留能力强,支持最多 16 张参考图,提供低/中/高三档质量。
它的不足在于速度较慢(约 30–45 秒,而 Nano Banana Pro 约为 10–15 秒),宽高比仅 3 种(1:1、3:2、2:3),因此通常作为其他模型失效时的兜底,而非首选。
提示词应采用直接的指令式表达:写"将 X 改为 Y",而不是"图像应当把 X 改成 Y";能简则简,比如"移除背景"而非"请把这张图的背景去掉";明确说明要改什么、保留什么,避免华丽或解释性的措辞。
提示词模板(生成):
示例:
多图合成模板:
多图合成示例:
快速选型参考
速度排序(由快到慢):Nano Banana → Seedream/Nano Banana Pro(两者相近)→ GPT Image 1.5(明显更慢)。

评论
0 条