2. 提示词结构


标准提示词结构

一个高质量的提示词通常由以下几个部分构成:

[总体描述] + [主体细节] + [场景/背景] + [风格/媒介] + [光线/氛围] + [排版文字(如有)]

各部分说明:

  • 总体描述(Overview):用一句话描述整张图像的核心内容,就像照片说明一样。
  • 主体细节(Subject Details):详细描述主体的外观特征——颜色、形状、材质、纹理、服饰等。如果需要图像中渲染文字,在此部分用双引号标注文字内容。
  • 场景/背景(Scene/Background):描述主体所处的环境和背景,增加空间感和叙事性。
  • 风格/媒介(Style/Medium):指定艺术风格或绘画媒介,如「写实摄影」「水彩插画」「3D渲染」「印象派油画」等。
  • 光线/氛围(Lighting/Mood):描述光线类型(自然光/摄影棚灯光/霓虹/烛光)和整体氛围(温暖/冷峻/神秘/欢乐)。
  • 排版文字(Typography):如需在图像中渲染文字,用双引号括起来,并描述字体风格和位置。

文字渲染专项技巧

Ideogram 最擅长的能力之一是在图像中精准渲染文字。以下是专门针对含文字图像的提示词技巧:

  1. 始终用双引号:需要渲染的文字必须用双引号括起来,如 "Hello World"
  2. 文字放提示词前部:把文字内容尽量靠前放置,让 AI 优先处理
  3. 描述字体风格:不要指定具体字体名称(AI 无法识别),而是用描述性语言,如「粗体无衬线字体」「优雅手写体」「复古衬线字体」
  4. 指定位置:描述文字在画面中的位置,如「顶部居中」「底部弧形排列」「左侧垂直排列」
  5. 保持文字简短:单词和短语的渲染准确率远高于长句子,尽量控制在25个字符以内