1. 提示词撰写指南
基础结构公式
无论是生成图片还是视频,高质量的提示词都遵循相似的结构逻辑。可灵官方提供的提示词公式如下:
括号中的内容可根据需要选填,核心三要素为主体、运动和场景。
各元素详解
图片提示词 vs 视频提示词的差异
- 图片提示词:可以包含更多静态细节,如服饰纹理、背景元素、构图方式、画质参数等
- 视频提示词:应聚焦于 5s 内可展现的动态画面,运动描述不宜过于复杂,需在有限时间内讲完一个完整的动态场景
图生视频与视频延长的提示词差异
图生视频和文生视频的提示词逻辑有所不同。文生视频需要完整描述场景、主体和运动,而图生视频已经有了画面作为参考,因此提示词只需聚焦于"主体+运动"即可。可灵会根据用户的文字指令和对图像画面的理解进行提示词扩写,自动补充场景信息。
如果涉及多个主体的多个运动,依次列举即可。需要注意的是,图生视频中不要重新描述图片已有的场景,只需描述你希望发生的动态变化。
视频延长(续写)功能有两种模式:"自动延长"无需输入提示词,模型根据对视频本身的理解进行续写;"自定义创意延长"允许用户通过文本控制延长内容,此时提示词需要与原视频保持关联,写明原视频的"主体+运动",以保证延长后的画面连贯不崩坏。
提示词优化技巧
从简单到丰富
善用否定描述
当用户不希望画面中出现某些元素时,可以在提示词末尾添加否定指令:
使用明确的风格词
控制画面比例