2. 图片生成(Image Generation)


功能介绍

Google AI Studio 的图片生成功能由 Nano Banana 系列和 Imagen 模型驱动。用户只需用自然语言描述想要的画面,AI 即可生成高质量图片。该功能支持全新图片创建、风格转换以及基于已有图片的编辑修改。

当前可用的图片生成模型:

模型名称是否收费说明
Nano Banana 2付费基于 Gemini 3.1 Flash Image Preview,专业级视觉智能与快速生成能力
Nano Banana Pro付费最强图片生成与编辑模型,画质最高
Nano Banana免费基于 gemini-2.5-flash-image,基础版图片生成与编辑模型

Nano Banana(免费版)基于 Gemini 2.5 Flash Image 架构,适合日常创作和快速实验。Nano Banana 2 和 Nano Banana Pro 需要链接付费 API Key 才能使用,在画面质量、文字渲染和细节还原方面更为出色。

使用方法

image-20260330164058947

在 Playground 主页点击「Image Generation(图片生成)」卡片。

image-20260330164620717

从模型列表中选择模型后,描述需求即可开始生成图片。

生成效果展示。

右侧设置面板(图片生成专属配置)

image-20260330164817669

  • 「System instructions(系统指令)」:设定图片生成的全局风格指令
  • 「No API Key(无 API 密钥)」:提示切换到付费密钥以解锁更多模型
  • 「Temperature(温度)」:控制创意随机性,默认 1。调高可获得更有创意的图片
  • 「Aspect ratio(宽高比)」:下拉选择,默认 Auto(自动),也可指定 1:1、16:9、9:16
  • 「Add stop sequence(添加停止序列)」: 设置模型遇到指定内容时即停止生成
  • 「Output length(输出长度)」: 限制模型单次输出文本的最大长度
  • 「Top P」: 调节模型生成的多样性和创造性

注意:Nano Banana 2 和 Nano Banana Pro 均需要付费 API Key 才能使用。如需使用,请点击「Link API Key(链接 API 密钥)」或前往左下角「Get API key(获取 API 密钥)」开通付费版。

使用技巧

  • 描述越具体,生成效果越好——包括主体、动作、环境、风格、光线、比例等
  • 使用排除指令去掉不想要的元素,如"不要出现文字"
  • 可以上传参考图片,让模型基于参考进行创作或编辑
  • 生成后可以追加指令进行迭代修改
  • Nano Banana Pro 对中文文字渲染的支持更好

提示词结构公式

[主体描述] + [动作/状态] + [环境/背景] + [风格] + [光线/氛围] + [比例/画质]

常见注意事项

可以生成会被过滤
虚构人物、创意角色真实名人肖像
风景、建筑、动物暴力、血腥内容
商业产品概念图色情、违规内容
艺术创作、插画侵犯版权的内容

示例

示例一:治愈系插画

一只圆滚滚的橘色猫咪,蜷缩在一本摊开的书上打盹,旁边放着一杯冒着热气的抹茶拿铁。窗外是樱花飘落的春日午后,阳光透过纱帘洒在桌面上。治愈系水彩插画风格,暖色调,柔和光线,正方形比例。

示例二:商业产品图

一款极简设计的蓝牙耳机,磨砂白色外壳,放置在浅灰色石板上。背景是模糊的城市天际线。产品摄影风格,侧光照明,干净利落,4:3横版比例,不要任何文字和水印。

示例三:概念艺术

一座悬浮在云层之上的未来城市,巨大的水晶穹顶覆盖整座城市,穹顶上方有环形航道,飞行器穿梭其间。科幻概念艺术风格,蓝紫色调为主,有夕阳余晖的暖色点缀。电影感,8K画质。

示例四:Logo 设计

为一家名为"Mountain Brew"的精品咖啡店设计logo。要求包含一座简约山峰和一杯咖啡的元素,使用极简线条风格。配色方案:深棕色和奶白色。正方形比例,矢量感,干净背景。

示例五:图片编辑(需上传原图)

请将这张照片转换成吉卜力动画风格,保持原始构图和人物姿态不变,但将整体画面改为手绘水彩的温暖感觉。

评论

0
还没有评论,来写第一条吧