2. 表演生成(Pikaformance)


功能介绍

表演生成(Pikaformance)是 Pika 的音频驱动表演功能,能够将静态的人物图片变为栩栩如生的说话、唱歌或表演视频。用户只需上传一张面向镜头的人物照片和一段音频,Pikaformance 就能生成口型同步、表情自然的"说话头像"视频。这项技术在近实时的速度下运行,生成的视频具有高度真实感的面部表情和头部动作。

Pikaformance 不仅限于人物——任何面向镜头的角色图片(包括动漫角色、动物、甚至卡通形象)都可以使用。音频来源也非常灵活,可以上传录音文件或直接在页面录制。

操作步骤

image-20260328154817086

在底部功能栏点击「Pikaformance(表演生成)」。

image-20260328154842941

点击「Upload an image(上传图片)」上传一张人物照片。

image-20260328154938980

点击「Add audio(添加音频)」上传或录制音频。支持上传MP3,WAV,M4A格式。

image-20260328155511662

在输入框中描述需求,点击右便按钮开始生成。

生成效果展示。

参数说明

参数说明
图片要求人物需面向镜头,清晰正面照效果最佳
音频时长免费用户最长 10 秒,付费用户最长 30 秒
输出分辨率固定 720p
积分消耗3 积分/秒
画面比例可在「Settings(设置)」中选择

使用技巧

  • 上传的人物照片应当正面面向镜头、光线均匀,避免侧脸或遮挡
  • 音频要清晰,背景噪音会影响口型同步效果
  • 在描述框中可以补充表演的情绪或风格,例如"开心且充满活力"或"沉稳且专业"
  • 尝试用不同类型的音频——说话、唱歌、说唱、甚至动物叫声,都能产生有趣的效果
  • 使用高分辨率的人物照片作为输入,可以提升生成视频的面部细节质量

适用场景

  • 虚拟主播或数字人的视频内容生成
  • 教育类视频的讲解人物动画
  • 音乐 MV 中的角色口型同步
  • 产品宣传中的虚拟代言人
  • 趣味内容创作(让照片中的人物"说话"或"唱歌")

注意事项

  • Pikaformance 的设置面板与其他功能不同,不提供分辨率切换(固定 720p)
  • 画面比例可选,但不支持自定义分辨率
  • 音频过长时生成的积分消耗会较高,建议先用短音频测试效果

示例

示例一

图片:一张正面商务人像照
音频:一段 10 秒的产品介绍录音
描述:专业的产品代言人正在进行产品推介,表情自信友好

示例二

图片:一张猫咪正面照
音频:一段欢快的歌曲片段
描述:一只可爱的猫咪跟着音乐唱歌,头部微微晃动,表情呆萌可爱

示例三

图片:一个动漫角色的正面插画
音频:一段日语对话录音
描述:动漫角色带有丰富表情地说话,戏剧化的动漫风格

示例四

图片:一张历史人物的肖像画(如蒙娜丽莎风格)
音频:一段朗诵诗歌的录音
描述:古典画像人物栩栩如生地复活,以优雅含蓄的表情朗诵诗歌

示例五

图片:一张可爱的小狗正面照
音频:一段搞笑的"狗说话"配音
描述:一只小狗像在说话一样,表情搞笑夸张,喜剧风格,网络表情包风格

评论

0
还没有评论,来写第一条吧