Vox — ハンズフリーでCopilotと会話する新しい開発体験
Voxは、GitHub Copilot CLIに音声インターフェースを追加する拡張機能です。/voxコマンドを実行するだけで、リアクティブな音声オーブが専用ウィンドウに表示され、話しかけると音声を認識し、エージェントが思考し、回答を音声で読み上げます。GitHub Copilotアプリ内でも同じパネルとして動作し、シームレスな開発ワークフローを実現します。
製品ハイライト
- ハンズフリー操作: マイクを一度許可すれば、タップして話すだけで自動送信。キーボードから手を離さずにCopilotと対話できます。
- 双方向音声コミュニケーション: 音声入力だけでなく、エージェントの回答も自動で音声合成して読み上げ。目を画面から離さずに情報を取得できます。
- リアクティブ・オーブ: 待機、聴取、思考、発話の各状態を色と動きで直感的に表示。常に対話の状態が一目でわかります。
- インタラプト機能: いつでも話を遮って自分の意見を入れられる。オーブをタップ、
Escキー、またはInterruptボタンで即座に発話を中断できます。
- マルチセッション対応: 複数のセッションを同時に管理し、ドロップダウンで切り替え可能。どのセッションで
/voxを実行しても自動的に対象を切り替えます。
- トランスクリプト機能: 📜パネルで対話履歴を全文表示。スクロールして確認したり、クリアしたりできます。
- ローカル実行: Pure JavaScriptで構築され、クラウド不要。Web Speech APIを活用し、テレメトリ収集も行いません。
- ワンラインインストール:
curlコマンド一つで即座に導入。Node.jsとgitがあれば、Windows・macOS・Linuxで動作します。
ユースケース
- コーディング中の集中維持: キーボードを打ちながら、並行してCopilotに質問。画面を切り替えずに音声で情報収集し、作業の流れを途切れさせません。
- アクセシビリティ向上: キーボード入力が困難な状況や、繰り返し使うコマンドを音声で素早く実行。より多くの開発者がCopilotを活用できます。
- ペアプログラミング: 複数人での開発時、音声でCopilotに指示を出し、回答を全員で聴取。画面を共有しながらスムーズにコラボレーションできます。
- モバイル開発環境: 狭い画面でも音声インターフェースで効率的に操作。ターミナルとエディタの往復を最小限に抑えます。
対象ユーザー
日々の開発でGitHub Copilotを活用しているエンジニアや、キーボード入力から解放されたいパワーユーザー、またアクセシブルな開発ツールを求めている方々に最適です。コマンドラインでの作業効率を最大化し、より自然な対話型の開発体験を追求する方におすすめします。