4. 数字人

数字人功能可以让用户上传一张角色图片和一段音频（或直接输入文字），即可生成角色"开口说话"的视频。数字人功能基于 OmniHuman 模型，能够实现嘴部、面部表情和身体动作的自然协调，适用于演讲、对白、短视频口播等场景。

上传角色图片（点击「+ 角色」按钮）。

输入说话内容，或点击「上传音频」上传本地录音。然后添加动作描述（可选）。

选择音色和语速（如果使用文字输入方式）。

选择模式，点击发送按钮开始生成。

生成效果展示。

示例一

角色图片：一张正面微笑的职业女性照片
说话内容：大家好，欢迎来到今天的产品发布会，我将为大家介绍我们最新的AI创作工具。
动作描述：镜头推进，对着镜头微笑说话

示例二

角色图片：一张古风人物立绘
说话内容：此去经年，应是良辰好景虚设。便纵有千种风情，更与何人说。
音色：温柔女声

示例三

角色图片：一张卡通IP形象
说话内容：嘿，朋友们！今天给大家分享一个超级实用的小技巧！
动作描述：摘下眼镜，对着镜头笑着说

示例四

角色图片：一张新闻主播风格照片
说话内容：据最新消息，本次科技大会将于明天正式开幕，届时将有超过200家企业参展。
动作描述：正面端庄播报，表情严肃专业

示例五

角色图片：一位穿汉服的古风男子
上传音频：一段本地录制的古文朗诵音频
动作描述：手持折扇，微微低头吟诵

0 条

登录后可以参与评论。

还没有评论，来写第一条吧

#4. 数字人