Hush v1.0
O Hush é o modelo de supressão de ruído de código aberto desenvolvido pela Weya AI, projetado para transformar chamadas ruidosas em áudio limpo e compreensível para aplicações de Voice AI. Com processamento em tempo real diretamente em CPU, o Hush elimina ruídos de fundo, vozes concorrentes e distrações ambientais, garantindo que bots, agentes humanos e sistemas de reconhecimento de fala (ASR) capturem cada palavra com precisão — mesmo nos ambientes mais desafiadores do mundo real.
Destaques do Produto
- Processamento em tempo real na CPU: Processa cada quadro de 10 ms em menos de 1 ms, sem necessidade de GPUs, mantendo as chamadas fluidas e de baixa latência.
- Modelo compacto e eficiente: Com apenas 8 MB de tamanho, pode ser implantado facilmente em nuvem própria ou data centers, oferecendo flexibilidade total de infraestrutura.
- Treinamento robusto com dados reais: Desenvolvido com mais de 10.000 horas de áudio ruidoso do mundo real, incluindo falas sobrepostas e ambientes complexos.
- Isolamento inteligente de vozes: Identifica e preserva a voz do interlocutor principal, eliminando conversas de fundo, TVs e outros sons competitivos.
- Código aberto e acessível: Disponível gratuitamente no Hugging Face e GitHub, permitindo integração transparente e personalização conforme necessidades específicas.
Casos de Uso
- Cobrança e call centers: Melhora a compreensão em chamadas de cobrança realizadas em ambientes ruidosos, aumentando a taxa de sucesso das negociações e reduzindo repetições.
- Qualificação de leads: Garante clareza em conversas de vendas e nutrição de leads, onde cada palavra pode fazer diferença na conversão.
- Atendimento ao cliente: Permite que agentes humanos e assistentes de IA entendam clientes mesmo quando há trânsito, construção ou barulho de escritório ao fundo.
- Sanção de empréstimos e serviços financeiros: Facilita a coleta precisa de informações sensíveis em chamadas de verificação, essencial para instituições de BFSI (banca, serviços financeiros e seguros).
Público-Alvo
O Hush é ideal para empresas de tecnologia financeira (fintechs), instituições bancárias, seguradoras, call centers e qualquer organização que dependa de Voice AI para comunicação com clientes em tempo real, especialmente aquelas que buscam soluções de código aberto para maior controle e redução de custos de infraestrutura.