7. 音频
功能介绍
Manus 的音频功能可以处理和生成音频内容,包括文字转语音、音频转录等能力。你可以用它来为幻灯片生成配音、将音频内容转化为文字、或者创作简单的音频素材。
如何使用

点击「更多」按钮选择「音频」,描述你的音频需求。
示例一:
示例二:
示例三:
通过文字描述生成原创音乐、背景音乐或歌曲片段,适用于视频配乐、内容创作、氛围音乐等场景。
提示词技巧
描述清楚风格类型 + 情绪氛围 + 乐器偏好 + 节奏/速度 + 用途。
示例一:
示例二:
示例三:
风格关键词速查
适用场景
- 短视频创作者:为抖音、B站、YouTube 等平台的视频内容制作原创背景音乐,避免版权风险
- 播客和有声内容:将文字稿件转化为带有专业播音腔调的语音,快速产出播客节目或有声读物片段
- 企业培训:为内部培训课件生成配音,统一培训素材的音频质量
- 线下活动:为活动、展会、门店制作氛围背景音乐,营造特定的空间氛围
- 多语言内容本地化:将中文讲解转录后翻译为英文,再用英文语音重新生成,实现快速的内容出海
音频转录技巧
音频转录是一个高频使用场景。以下建议可以帮助你获得更好的转录效果:
- 明确转录要求:说明是否需要逐字转录还是精简整理,是否保留口语化表达、语气词等
- 指定输出格式:可以要求输出为带时间戳的逐字稿、会议纪要格式、或按发言人分段的对话记录
- 多语言混合:如果音频中包含中英文混合内容,提前告知 Manus,以便更准确地识别和转录
- 后续加工:转录完成后,可以在同一对话中继续要求 Manus 提炼要点、生成摘要、或整理成特定格式的文档
实用技巧
-
先 Chat 后 Agent:在免费的 Chat 模式中打磨好文案或确认音乐风格,再切换 Agent 生成,省积分
-
明确停顿和时长:语音用"停顿2秒"指定间隔;音乐用"时长30秒"指定长度,比模糊描述效果好
-
A/B 对比:让 Manus 同时生成2~3个版本(不同声音/不同风格),对比选最佳
-
口语化改写:书面文字直接转语音容易生硬,先让 Manus 改成口播风格再生成
-
功能联动:语音 + 幻灯片 = 带配音演示;音乐 + 视频 = 完整短片;语音 + 音乐 = 有旁白有配乐的完整音频
-
指定"不要什么":音乐生成中,写清楚不想要的元素同样重要,比如"不要人声""不要鼓点""不要太激烈"