Heron
Heron é uma plataforma de observabilidade passiva que analisa tráfego de LLMs diretamente na rede, reconstruindo o comportamento real dos agentes de IA — desde chamadas de ferramentas até planos multi-etapa, gargalos de tempo e loops de execução. Sem necessidade de SDK, sidecar ou proxy no caminho da requisição.
Destaques do Produto
- Observabilidade passiva: Captura tráfego LLM diretamente do fio de rede, sem interferir nas chamadas em execução
- Reconstrução de turnos de agente: Une chamadas múltiplas (planejador → ferramenta → planejador) em interações endereçáveis e compreensíveis
- Métricas operacionais em tempo real: TTFT, latência E2E, throughput de tokens, taxa de cache e outras métricas críticas em janelas deslizantes
- Compatibilidade universal: Funciona com Claude Code, OpenAI Codex, Hermes, OpenClaw e qualquer agente genérico via perfis de análise
- Arquitetura zero-impacto: Escrita em Rust, nunca no caminho da requisição, falha sem quebrar as chamadas observadas
Casos de Uso
- Depuração de agentes em produção: Identifique loops infinitos, ferramentas travadas e comportamentos inesperados que logs tradicionais não revelam
- Otimização de custos e latência: Analise padrões de uso de tokens, taxas de cache e gargalos de tempo para reduzir gastos com inferência
- Governança de IA corporativa: Monitore quais modelos são realmente utilizados, quem chama quem, e garanta conformidade sem modificar código cliente
- Geração de dados de treinamento: Exporte trajetórias de turnos e sessões em formato JSONL para fine-tuning supervisionado (SFT)
Público-Alvo
Ideal para equipes de plataforma, engenheiros de MLops e arquitetos de IA que precisam visibilidade completa sobre agentes LLM em produção sem impor overhead ou mudanças de código aos desenvolvedores.