2. 表演生成（Pikaformance）

功能介绍

表演生成（Pikaformance）是 Pika 的音频驱动表演功能，能够将静态的人物图片变为栩栩如生的说话、唱歌或表演视频。用户只需上传一张面向镜头的人物照片和一段音频，Pikaformance 就能生成口型同步、表情自然的"说话头像"视频。这项技术在近实时的速度下运行，生成的视频具有高度真实感的面部表情和头部动作。

Pikaformance 不仅限于人物——任何面向镜头的角色图片（包括动漫角色、动物、甚至卡通形象）都可以使用。音频来源也非常灵活，可以上传录音文件或直接在页面录制。

操作步骤

在底部功能栏点击「Pikaformance（表演生成）」。

点击「Upload an image（上传图片）」上传一张人物照片。

点击「Add audio（添加音频）」上传或录制音频。支持上传MP3，WAV，M4A格式。

在输入框中描述需求，点击右便按钮开始生成。

生成效果展示。

参数说明

参数	说明
图片要求	人物需面向镜头，清晰正面照效果最佳
音频时长	免费用户最长 10 秒，付费用户最长 30 秒
输出分辨率	固定 720p
积分消耗	3 积分/秒
画面比例	可在「Settings（设置）」中选择

使用技巧

上传的人物照片应当正面面向镜头、光线均匀，避免侧脸或遮挡
音频要清晰，背景噪音会影响口型同步效果
在描述框中可以补充表演的情绪或风格，例如"开心且充满活力"或"沉稳且专业"
尝试用不同类型的音频——说话、唱歌、说唱、甚至动物叫声，都能产生有趣的效果
使用高分辨率的人物照片作为输入，可以提升生成视频的面部细节质量

适用场景

虚拟主播或数字人的视频内容生成
教育类视频的讲解人物动画
音乐 MV 中的角色口型同步
产品宣传中的虚拟代言人
趣味内容创作（让照片中的人物"说话"或"唱歌"）

注意事项

Pikaformance 的设置面板与其他功能不同，不提供分辨率切换（固定 720p）
画面比例可选，但不支持自定义分辨率
音频过长时生成的积分消耗会较高，建议先用短音频测试效果

示例

示例一

图片：一张正面商务人像照
音频：一段 10 秒的产品介绍录音
描述：专业的产品代言人正在进行产品推介，表情自信友好

示例二

图片：一张猫咪正面照
音频：一段欢快的歌曲片段
描述：一只可爱的猫咪跟着音乐唱歌，头部微微晃动，表情呆萌可爱

示例三

图片：一个动漫角色的正面插画
音频：一段日语对话录音
描述：动漫角色带有丰富表情地说话，戏剧化的动漫风格

示例四

图片：一张历史人物的肖像画（如蒙娜丽莎风格）
音频：一段朗诵诗歌的录音
描述：古典画像人物栩栩如生地复活，以优雅含蓄的表情朗诵诗歌

示例五

图片：一张可爱的小狗正面照
音频：一段搞笑的"狗说话"配音
描述：一只小狗像在说话一样，表情搞笑夸张，喜剧风格，网络表情包风格

0 条

登录后可以参与评论。

还没有评论，来写第一条吧

#2. 表演生成（Pikaformance）

#功能介绍

#操作步骤

#参数说明

#使用技巧

#适用场景

#注意事项

#示例

评论