7. 提示词常见误区与解决方案
描述过于模糊
这是最常见的问题。过于简短或笼统的提示词会让模型自行发挥,结果充满不确定性。
描述过于复杂
相反的极端也需要避免。在一个 5 秒的视频中堆砌过多元素和动作,会导致模型无法同时兼顾,最终画面混乱或出现变形。
💡 建议:视频提示词中包含 3-5 个核心视觉元素效果最佳,超过 7 个元素就容易导致画面"过载"。
图生视频中重复描述场景
使用图生视频时,图片本身已经提供了场景信息。此时提示词应只描述主体运动,不要再重复描述图中已有的内容。
数量描述不精确
可灵 AI 对具体数量的理解有时不够精确,"5棵树"可能变成"3棵"或"7棵"。建议在必须保证数量准确的情况下,使用图生视频模式,先通过图片精确控制构图。
物理运动描述不合理
在描述复杂物理运动(如球体弹跳轨迹、高空抛物等)时,模型可能无法完美模拟。建议用更简洁的动作替代,或添加物理质感词汇来辅助模型理解: