3. 语音对话


Grok 提供了实时语音交互功能,让你可以像打电话一样与 AI 进行自然对话。

进入语音模式

image-20260325191358582

点击左侧边栏或对话框右边的「语音」按钮,Grok 会显示"连接中"的提示,随后进入语音通话界面。底部状态栏会显示"正在连接到 Grok..."字样和一个「停止」按钮。

语音设置

连接成功后,点击底部工具栏的设置按钮可以自定义语音体验。Grok 提供三个维度的个性化选项:

声音选择

Grok 目前提供6种不同风格的声音:

声音名风格描述
AraUpbeat Female(活泼女声)
EveSoothing Female(温柔女声)
LeoBritish Male(英式男声)
RexCalm Male(沉稳男声)
SalSmooth Male(温润男声)
GorkLazy Male(慵懒男声)

个性化模式

在「个性化」下拉菜单中,可以选择 Grok 的对话人格。默认为 Assistant(助手模式),适合大多数场景。

语速调节

通过底部的速度滑块调整 Grok 的说话速度,默认为 1.0x,可以根据个人习惯加快或减慢。

语音交互特点

  • 支持实时打断:你可以随时插话,Grok 会立即停止当前回答并响应新的内容
  • 支持多语言:Grok 语音模式支持数十种语言的实时对话
  • 低延迟响应:基于 xAI 的语音 API 技术,响应延迟很低,接近自然对话的流畅度

实用场景

示例一:语言练习

"Let's practice English conversation. I want to talk about my travel plans to Japan."

示例二:头脑风暴

"我在想一个创业点子,关于用 AI 帮助老年人使用智能手机,帮我分析一下可行性。"

示例三:无障碍使用

对于不便打字的场景(如开车、做家务、视障用户),语音模式提供了最自然的交互方式。

注意事项

  • 语音对话需要稳定的网络连接
  • 首次使用需要授权麦克风权限
  • 通话过程中可以随时点击「停止」按钮结束语音模式
  • 语音模式下的对话同样会保存到历史记录中(私密模式除外)