2. 表演生成(Pikaformance)
功能介绍
表演生成(Pikaformance)是 Pika 的音频驱动表演功能,能够将静态的人物图片变为栩栩如生的说话、唱歌或表演视频。用户只需上传一张面向镜头的人物照片和一段音频,Pikaformance 就能生成口型同步、表情自然的"说话头像"视频。这项技术在近实时的速度下运行,生成的视频具有高度真实感的面部表情和头部动作。
Pikaformance 不仅限于人物——任何面向镜头的角色图片(包括动漫角色、动物、甚至卡通形象)都可以使用。音频来源也非常灵活,可以上传录音文件或直接在页面录制。
操作步骤

在底部功能栏点击「Pikaformance(表演生成)」。

点击「Upload an image(上传图片)」上传一张人物照片。

点击「Add audio(添加音频)」上传或录制音频。支持上传MP3,WAV,M4A格式。

在输入框中描述需求,点击右便按钮开始生成。
生成效果展示。
参数说明
使用技巧
- 上传的人物照片应当正面面向镜头、光线均匀,避免侧脸或遮挡
- 音频要清晰,背景噪音会影响口型同步效果
- 在描述框中可以补充表演的情绪或风格,例如"开心且充满活力"或"沉稳且专业"
- 尝试用不同类型的音频——说话、唱歌、说唱、甚至动物叫声,都能产生有趣的效果
- 使用高分辨率的人物照片作为输入,可以提升生成视频的面部细节质量
适用场景
- 虚拟主播或数字人的视频内容生成
- 教育类视频的讲解人物动画
- 音乐 MV 中的角色口型同步
- 产品宣传中的虚拟代言人
- 趣味内容创作(让照片中的人物"说话"或"唱歌")
注意事项
- Pikaformance 的设置面板与其他功能不同,不提供分辨率切换(固定 720p)
- 画面比例可选,但不支持自定义分辨率
- 音频过长时生成的积分消耗会较高,建议先用短音频测试效果
示例
示例一
示例二
示例三
示例四
示例五

评论
0 条