Heron：AI智能体被动网络观测工具

Heron — 网络层智能体可观测性平台

Heron 是一款基于网络流量被动分析的 LLM 智能体可观测性工具，无需修改代码、无需部署代理、无需介入请求链路，即可从网络数据包中还原智能体的真实行为——工具调用、多步规划、时间消耗、循环陷阱、调用链路一目了然。

零侵入部署：无需 SDK、无需反向代理、不驻留在请求路径上，从网络层被动捕获流量，观测系统故障不影响业务调用
智能体行为还原：自动识别 Claude Code、OpenAI Codex、Hermes、OpenClaw 等主流智能体协议，将多轮工具调用组装为可追踪的单一回合（turn）
全量请求解析：捕获完整的请求与响应体，支持 OpenAI、Anthropic、Azure OpenAI、Gemini、vLLM、Ollama 等主流 LLM 服务商
Rust 高性能核心：基于 libpcap、eBPF 和零拷贝技术实现微秒级包处理，单节点可承载高并发流量分析
实时指标聚合：内置 TTFT（首 token 时间）、E2E 端到端延迟、TPOT（输出 token 间隔）、缓存命中率等 8 项关键运营指标
灵活数据存储：默认 DuckDB 嵌入式存储，可选 PostgreSQL + TimescaleDB 或 ClickHouse 应对高吞吐场景
训练数据导出：一键导出 SFT 轨迹数据（JSONL 格式），支持工具调用、推理过程、会话历史的结构化提取

生产环境智能体监控：当智能体在纸面上运行良好却在生产环境频繁超时、循环调用、隐式降级时，Heron 从网络层还原真实执行路径，快速定位 planner 循环、工具阻塞、模型替换等根因
性能优化与成本分析：通过 token 吞吐量、缓存命中率、调用速率等指标，识别慢查询、冗余调用和成本异常，支撑容量规划与模型选型决策
安全审计与合规溯源：留存完整的请求响应记录，满足金融、医疗等行业的审计要求，支持按会话、回合、工具调用多维度的行为追溯
智能体训练数据构建：将生产环境的真实交互轨迹导出为标准 JSONL 格式，直接用于监督微调（SFT）和强化学习的数据准备
多云混合架构观测：通过 cloud-probe 从 SPAN/TAP 镜像点接收流量，统一观测跨云、跨机房的分布式智能体部署

Heron 主要面向在生产环境部署 LLM 智能体的技术团队——包括 AI 平台工程师、MLOps 工程师、后端架构师以及关注智能体可靠性和性能优化的工程负责人，特别适用于对系统侵入性敏感、追求零改造接入的企业级用户。