Heron — 网络层智能体可观测性平台
Heron 是一款基于网络流量被动分析的 LLM 智能体可观测性工具,无需修改代码、无需部署代理、无需介入请求链路,即可从网络数据包中还原智能体的真实行为——工具调用、多步规划、时间消耗、循环陷阱、调用链路一目了然。
产品亮点
- 零侵入部署:无需 SDK、无需反向代理、不驻留在请求路径上,从网络层被动捕获流量,观测系统故障不影响业务调用
- 智能体行为还原:自动识别 Claude Code、OpenAI Codex、Hermes、OpenClaw 等主流智能体协议,将多轮工具调用组装为可追踪的单一回合(turn)
- 全量请求解析:捕获完整的请求与响应体,支持 OpenAI、Anthropic、Azure OpenAI、Gemini、vLLM、Ollama 等主流 LLM 服务商
- Rust 高性能核心:基于 libpcap、eBPF 和零拷贝技术实现微秒级包处理,单节点可承载高并发流量分析
- 实时指标聚合:内置 TTFT(首 token 时间)、E2E 端到端延迟、TPOT(输出 token 间隔)、缓存命中率等 8 项关键运营指标
- 灵活数据存储:默认 DuckDB 嵌入式存储,可选 PostgreSQL + TimescaleDB 或 ClickHouse 应对高吞吐场景
- 训练数据导出:一键导出 SFT 轨迹数据(JSONL 格式),支持工具调用、推理过程、会话历史的结构化提取
应用场景
- 生产环境智能体监控:当智能体在纸面上运行良好却在生产环境频繁超时、循环调用、隐式降级时,Heron 从网络层还原真实执行路径,快速定位 planner 循环、工具阻塞、模型替换等根因
- 性能优化与成本分析:通过 token 吞吐量、缓存命中率、调用速率等指标,识别慢查询、冗余调用和成本异常,支撑容量规划与模型选型决策
- 安全审计与合规溯源:留存完整的请求响应记录,满足金融、医疗等行业的审计要求,支持按会话、回合、工具调用多维度的行为追溯
- 智能体训练数据构建:将生产环境的真实交互轨迹导出为标准 JSONL 格式,直接用于监督微调(SFT)和强化学习的数据准备
- 多云混合架构观测:通过 cloud-probe 从 SPAN/TAP 镜像点接收流量,统一观测跨云、跨机房的分布式智能体部署
目标受众
Heron 主要面向在生产环境部署 LLM 智能体的技术团队——包括 AI 平台工程师、MLOps 工程师、后端架构师以及关注智能体可靠性和性能优化的工程负责人,特别适用于对系统侵入性敏感、追求零改造接入的企业级用户。