1. 提示词撰写指南


基础结构公式

无论是生成图片还是视频,高质量的提示词都遵循相似的结构逻辑。可灵官方提供的提示词公式如下:

提示词 = 主体(主体描述)+ 运动 + 场景(场景描述)+(镜头语言 + 光影 + 氛围)

括号中的内容可根据需要选填,核心三要素为主体、运动和场景。

各元素详解

元素说明示例
主体视频/图片中的主要表现对象一位穿白裙的少女、一只橘色英短猫
主体描述外貌细节、服饰穿搭、五官姿态等银色长发、佩戴红色围巾、手持雨伞
运动主体的动作或行为状态缓慢转身、奔跑、微笑挥手
场景主体所处的环境樱花树下、未来都市街头、海边沙滩
场景描述环境的细节补充夕阳西下、薄雾弥漫、霓虹灯闪烁
镜头语言拍摄角度和镜头效果航拍、特写、背景虚化、低角度仰拍
光影光线类型和效果金色侧光、逆光剪影、柔和自然光
氛围整体情绪和色调基调温暖治愈、神秘悬疑、史诗磅礴

图片提示词 vs 视频提示词的差异

  • 图片提示词:可以包含更多静态细节,如服饰纹理、背景元素、构图方式、画质参数等
  • 视频提示词:应聚焦于 5s 内可展现的动态画面,运动描述不宜过于复杂,需在有限时间内讲完一个完整的动态场景

图生视频与视频延长的提示词差异

图生视频和文生视频的提示词逻辑有所不同。文生视频需要完整描述场景、主体和运动,而图生视频已经有了画面作为参考,因此提示词只需聚焦于"主体+运动"即可。可灵会根据用户的文字指令和对图像画面的理解进行提示词扩写,自动补充场景信息。

图生视频提示词 = 主体 + 运动,背景 + 运动

如果涉及多个主体的多个运动,依次列举即可。需要注意的是,图生视频中不要重新描述图片已有的场景,只需描述你希望发生的动态变化。

视频延长(续写)功能有两种模式:"自动延长"无需输入提示词,模型根据对视频本身的理解进行续写;"自定义创意延长"允许用户通过文本控制延长内容,此时提示词需要与原视频保持关联,写明原视频的"主体+运动",以保证延长后的画面连贯不崩坏。

✅ 好的续写提示词:"少女继续向前奔跑,裙摆随风飘动,镜头缓缓拉远"
❌ 差的续写提示词:"一片星空下的城堡"(与原视频无关,容易导致画面割裂)

提示词优化技巧

从简单到丰富

❌ 基础:"一只猫"

✅ 进阶:"一只橘色的英短猫慵懒地趴在窗台上,窗外是春日的花园,
       吉卜力动画风格,温暖午后阳光,16:9比例"

善用否定描述

当用户不希望画面中出现某些元素时,可以在提示词末尾添加否定指令:

"...不要出现文字和水印"
"...排除现代元素"
"...避免出现人物"

使用明确的风格词

类别推荐关键词
传统绘画油画、水彩、水墨画、工笔画、浮世绘
数字艺术3D渲染、低多边形、赛博朋克、蒸汽朋克
摄影风格人像摄影、微距、长焦压缩、浅景深、富士胶片色调
动画风格吉卜力风格、皮克斯风格、90年代日漫风、儿童绘本
设计风格极简主义、扁平设计、孟菲斯风格、波普艺术

控制画面比例

比例方向适用场景
1:1正方形社交媒体头像、封面
16:9横版电脑壁纸、视频封面
9:16竖版手机壁纸、抖音/小红书封面
3:4竖版海报、书籍封面
4:3横版演示文稿、传统屏幕