语音模式

终端里的对讲机,按住说话松开发送

操作6 分钟

Voice Mode 是 Claude Code 内置的语音输入功能。按住按键说话,松开后语音实时转写为文字,直接进入输入框。基于云端流式语音转文字(streaming STT),转写文本不计入速率限制。

一、最简上手

前提条件:

  • Claude Code v2.1.69 或更高版本
  • 使用 Claude.ai 账户认证(API Key、Bedrock、Vertex 不支持)
  • 本地麦克风可用(不支持纯远程环境和 Web 版)
  • 订阅计划:Pro / Max / Team / Enterprise

二、更多操作方式

混合打字与语音

同一条消息中可以自由组合打字和语音。先打一部分文字,按住空格补充语音,再继续打字。语音转写的文字插入在当前光标位置。

适用场景:先粘贴文件路径或 URL,再用语音描述上下文和操作意图。

自定义 Push-to-Talk 按键

空格键的预热延迟来自按键重复检测。修饰键组合(如 meta+k)按下即识别,无预热等待。

  • "space": null 移除空格键的默认绑定,仅保留 meta+k
  • 去掉 "space": null 则两个键同时可用
  • 避免绑定普通字母键(如 v),预热期间会输入该字符

三、参数与配置

语音相关配置通过 /config 命令或直接编辑 settings.json

配置项作用示例值
voiceEnabled持久化开启语音模式true
language语音转录语言(同时控制 Claude 回复语言)"en", "ja", "ko"

支持语言

语音转录支持 20 种语言,语言设置同时影响 Claude 的回复语言和转录语言:

付费内容

继续阅读完整课程

购买后即可解锁全部 16 个功能模块、实战场景与深度配置。

¥199¥399
  • 30 分钟完成第一个真实任务
  • 实战场景 + 深度配置
  • 长期访问,持续更新