Hush v1.0 ノイズ抑制モデル
Weya AIが開発したオープンソースのノイズ抑制モデル「Hush」は、リアルタイム通話における背景雑音や重なった音声を高精度に除去し、ボイスAIシステムの認識精度を劇的に向上させます。カフェの喧騒や道路の騒音、建設現場の音など、過酷な環境下でもクリアな音声を実現し、顧客対話の質を根本から変革します。
製品の主な特徴
- リアルタイムCPU処理: 10msの音声フレームを0.9msで処理し、GPU不要で低遅延を維持
- ターゲット音声分離: 主発話者の声を特定し、背景の会話やテレビ音を自動抑制
- 過酷環境対応: 交通騒音、オフィス雑音、ファン音、街の喧騒など多様なノイズに対応
- 軽量モデル: 約8MBのコンパクトサイズで、自社クラウドやデータセンターへの導入が容易
- ASR最適化: 音声認識エンジンに最適化されたクリーンな音声出力を提供
活用シーン
- コールセンター運営: 在宅勤務や騒音環境下でもエージェントと顧客の双方向コミュニケーションを鮮明に保つ
- 自動音声応答(IVR): ボットの音声認識精度を向上し、「もう一度お願いします」の発生を削減
- 金融機関のコンプライアンス録音: 法的要件を満たす高品質な通話記録を確保
- 債権回収業務: 雑音に埋もれがちな重要な顧客発言を確実に捉える
対象ユーザー
ボイスAIシステムを導入する企業、特にBFSI(銀行・金融サービス・保険)業界のコールセンター運営者や、リアルタイム音声処理を必要とする開発チームに最適です。