1. 提示词的基本结构


官方推荐的通义万相提示词公式如下:

视频提示词公式

主体 + 场景 + 运动 + 声音描述(可选:人声 / 音效 / 背景音乐)

图片提示词公式

主体 + 场景 + 光线 + 风格 + 色调 + 构图/比例

各要素详解

要素说明示例
主体画面的核心元素,人物、动物、物体等一只橙色短毛猫、一名年轻女性、一辆赛车
场景时间、地点、环境背景冬日清晨的雪地庭院、霓虹灯闪烁的城市街道
运动主体的动作、移动方向、镜头运动缓缓走向镜头、镜头从左向右横移
光线光源类型和方向丁达尔效应阳光、逆光剪影、霓虹灯环境光
风格画面的整体视觉风格电影感、水墨风、赛博朋克、日系清新
色调画面主色调或配色倾向暖橙色调、冷蓝色系、黑白灰
声音人声内容、音效、背景音乐类型轻柔钢琴配乐、城市街道噪音、鸟鸣虫叫

基础版与进阶版对比

基础版(适合入门用户)

一只猫在雪地里玩雪球。

进阶版(适合有经验的用户)

主体:一只毛茸茸的小奶猫
场景:冬日清晨的雪地,银装素裹的庭院,积雪厚实松软,周围有结霜的树枝
运动:小猫用前爪滚起一个雪球,笨拙地推着前进,突然雪球裂开,它惊得后跳,又好奇地凑近
声音:爪子踩雪的"咯吱"声、雪球破裂的"咔啦"声,轻快温馨的钢琴童谣配乐