16. AI 音频


AI 音频是 Genspark 的语音和音效生成工具,支持将文字转化为逼真的语音,或根据描述生成特定的音效。它集成了 Gemini、ElevenLabs、Minimax、Muneka、Lyria2 等多款音频生成模型,适用于配音、有声读物制作、音效创作等场景。

使用技巧

  • 可以选择自动选择模型或手动指定特定模型
  • 支持多种语言和音色选择
  • 可以上传参考音频来引导生成风格
  • 适合与 AI 播客、AI 视频等功能联动使用

示例一

将以下文字转换为专业女声配音,语速适中,语调温柔:[各位旅客朋友们,大家好!欢迎乘坐G1234次高速列车,本次列车由北京南站开往上海虹桥站。列车沿途经停济南西站、南京南站,终点站上海虹桥站,全程预计运行时间为四小时三十五分钟。]

生成效果展示

示例二

生成一段30秒的轻松愉快的背景音乐,适合产品宣传视频使用

示例三

创建一段森林环境音效,包含鸟鸣、溪流和微风吹过树叶的声音

示例四

用深沉有磁性的男声朗读这段文章,语速稍慢,适合睡前故事

示例五

生成一段科技感十足的音效,适合用作APP启动音或通知提示音