メインコンテンツへスキップ
ブログ一覧

Claude Code Voice Mode(/voice)完全ガイド — 音声駆動開発のセットアップから実践ワークフローまで

(更新: 2026年03月05日)
Claude CodeVoice Mode音声コーディング開発ワークフロー

2026年3月3日、Anthropicは Claude Code に Voice Mode を正式に追加した。ターミナル上で /voice と打つだけで、音声による指示がそのままコード変更に変わる。トランスクリプショントークンは無料、プランの使用量にカウントされない。本記事では、セットアップから実践的なワークフローへの組み込み方までを解説する。

Voice Mode の概要と対応プラン

Voice Mode は Claude Code の組み込み機能として提供される。対応プランは Pro・Max・Team・Enterprise の4つで、追加料金は発生しない。音声の文字起こし(トランスクリプション)に使われるトークンはレート制限の対象外となっており、ヘビーに使っても通常のコーディング枠を圧迫しない点が大きい。

現時点では段階的ロールアウト中で、約5%のユーザーに開放されている。アクセス可能になると、Claude Code 起動時のウェルカムスクリーンに通知が表示される。

セットアップ手順

特別なインストールは不要だ。Claude Code を最新版にアップデートするだけでいい。

bash
# Claude Code を最新版に更新
claude update

# Voice Mode を有効化
claude
> /voice

/voice を入力するとトグルでオン・オフが切り替わる。有効化すると、プロンプト入力エリアにマイクのインジケーターが表示される。初回起動時にマイクへのアクセス許可を求められるので、ターミナルアプリ(Terminal.app や iTerm2 など)に対してマイクパーミッションを付与する必要がある。

macOS の場合:

code
システム設定 → プライバシーとセキュリティ → マイク → 使用中のターミナルアプリを許可

Push-to-Talk の操作方法

Voice Mode は Push-to-Talk(PTT)方式のみ を採用している。常時リスニングモードは意図的に搭載されていない。ターミナル環境では誤入力のリスクが高いため、これは合理的な設計判断だ。

操作はシンプルで、スペースバーを長押ししながら話し、離すと送信される。文字起こしされたテキストはカーソル位置にリアルタイムで挿入される。

code
[スペースバー長押し] → 「この関数をリファクタリングして、エラーハンドリングを追加して」 → [離す]

正直、最初は「スペースバー長押し」という操作に少し戸惑った。普段スペースキーを連打する癖があると、意図せず録音が始まることがある。慣れるまでは意識的に操作するといい。

実践ワークフロー: タイピングと音声のハイブリッド入力

Voice Mode の真価は、キーボード入力との シームレスな切り替え にある。ファイルパスや変数名はタイピングで正確に入力し、ロジックの説明や意図の伝達は音声で行う——この使い分けが最も効率的だ。

パターン1: リファクタリング指示

code
[タイプ] src/auth/middleware.ts の
[音声] authenticateUser関数をリファクタリングしたい。
       現状try-catchが3重にネストしていて読みにくいので、
       early returnパターンに書き換えて、エラーは個別の関数に切り出して
[タイプ] AuthError クラスを使ってほしい

パターン2: バグ報告・デバッグ

code
[音声] ログイン後にダッシュボードに遷移するとき、たまに白い画面が出る。
       再現条件はまだ特定できてないけど、Safariで起きやすい気がする。
       認証トークンの受け渡しあたりが怪しいと思ってる
[タイプ] src/hooks/useAuth.ts と src/pages/dashboard.tsx を確認して

パターン3: コードレビュー

code
[タイプ] git diff HEAD~3 の変更を見て
[音声] セキュリティの観点からレビューしてほしい。特にユーザー入力の
       バリデーションが漏れてないか、SQLインジェクションの可能性がないかを
       重点的にチェックして

コツは「音声で意図・理由を、タイピングで精度が求められる識別子を」という原則だ。src/components/AuthProvider.tsx のようなパスを音声で伝えると、トランスクリプションが auth provider dot TSX のように変換されてしまうことがある。

Hooks・Skills との組み合わせ

Voice Mode は既存の Claude Code エコシステムとそのまま併用できる。音声で入力されたテキストも、通常のテキスト入力と全く同じように処理されるためだ。

Hooks との連携例

Voice Mode で発話した内容がファイル編集につながった場合、PostToolUse フックが通常通り発火する。たとえば、編集後に自動フォーマットを走らせる Hook を設定している場合:

json
// .claude/hooks.json
{
  "PostToolUse": [
    {
      "matcher": "Edit|Write",
      "command": "npx prettier --write $CLAUDE_FILE_PATH"
    }
  ]
}

音声で「この関数を修正して」と指示した場合でも、Edit ツールが使われた後に Prettier が自動実行される。Voice Mode だからといって Hook が無視されることはない。

Skills(スラッシュコマンド)との併用

Voice Mode を有効にした状態でも、スラッシュコマンドはタイピングで入力する。たとえば /commit と打ってからコミットメッセージの説明を音声で補足する、というフローが自然だ。

code
[タイプ] /commit
[音声] 認証ミドルウェアのリファクタリングで、エラーハンドリングを
       early returnパターンに統一した変更をコミットして

現時点での制限事項

  • 英語最適化: 初期リリースは英語に最適化されている。日本語の認識精度は公式にはサポート外
  • Push-to-Talk のみ: ハンズフリー(常時リスニング)モードは非搭載
  • 段階的ロールアウト: 全ユーザーへの開放時期は未定(2026年3月時点で約5%)
  • Agent SDK 非対応: ターミナルインタラクティブ機能のため、SDK からのプログラマティックな利用は不可
  • ファイルパスの認識精度: パスやコード識別子の音声認識は不安定なため、タイピングとの併用が前提

まとめ

Claude Code Voice Mode は「キーボードを完全に置き換える」ものではなく、タイピングと音声を状況に応じて使い分ける新しい入力チャネルだ。特に、コードを目で追いながら口頭でリファクタリングの意図を伝える、デバッグの状況を口頭で説明する、といったシーンでは、タイピングだけでは得られないスピードと表現力がある。

トランスクリプショントークンが無料という点も、気軽に試せる理由になる。ロールアウトが自分に回ってきたら、まずは /voice を有効にして、スペースバーを長押ししてみてほしい。これは地味に便利だ。


参考リンク