Heron
Heron es un analizador pasivo que observa el tráfico de LLMs en la red y reconstruye lo que tus agentes están haciendo realmente: llamadas a herramientas, planes de múltiples pasos, dónde se pierde el tiempo, dónde ocurren bucles y quién llama a quién. Sin SDK, sin sidecar y sin proxy en la ruta de la solicitud. Obtén visibilidad completa del comportamiento de tus agentes de IA sin modificar ni interrumpir tu infraestructura existente.
Destacados del Producto
- Observabilidad pasiva: Captura tráfico de LLM directamente desde la red sin necesidad de integrar SDKs ni modificar el código de tus aplicaciones
- Reconstrucción de turnos de agente: Une automáticamente interacciones de múltiples llamadas (planificador → herramienta → planificador → herramienta) en turnos individuales direccionables
- Sin impacto en la ruta de solicitud: El observador puede fallar sin interrumpir las llamadas que observa, eliminando riesgos de producción
- Soporte multi-proveedor: Compatible con Claude Code, OpenAI Codex, Hermes, OpenClaw y cualquier agente genérico mediante perfiles de detección automática
- Métricas operativas en tiempo real: Ocho señales clave incluyendo TTFT, latencia E2E, TPOT, tasa de llamadas, throughput de tokens y ratio de acierto de caché
- Escrito en Rust: Alto rendimiento con procesamiento sin bloqueos y uso eficiente de recursos
Casos de Uso
- Depuración de agentes en producción: Identifica por qué el código que "se ve bien en papel" falla en producción — bucles del planificador, llamadas a herramientas bloqueadas o sustituciones silenciosas de modelos
- Optimización de latencia: Analiza dónde se pierde el tiempo en flujos de múltiples pasos y optimiza el rendimiento de tus agentes de IA
- Creación de datos de entrenamiento: Exporta trayectorias de turnos y sesiones en formato JSONL para fine-tuning supervisado de modelos
- Monitoreo de infraestructura de IA: Observa múltiples clusters y proveedores desde un punto único sin necesidad de instrumentación por cliente
Audiencia Objetivo
Heron está diseñado para equipos de ingeniería de plataformas, ingenieros de confiabilidad de sitios (SRE) y desarrolladores de aplicaciones de IA que necesitan visibilidad profunda del comportamiento de sus agentes en producción sin asumir los riesgos operativos de soluciones en línea. Ideal para organizaciones que operan múltiples proveedores de LLM o frameworks de agentes y buscan una única fuente de verdad pasiva e inmutable.