Heron  logo

Heron .

洞悉AI智能体真实行为,无需改动一行代码

零侵入eBPF观测方案,被动捕获AI智能体TLS加密流量,精准识别LLM调用来源进程,无需SDK或代理。

周排行
▲ #74
支持数
111
适配平台
Web / Mobile
上线时间
Recently
Heron  screenshot

更多关于 Heron 的信息

Heron — 网络层智能体可观测性平台

Heron 是一款基于网络流量被动分析的 LLM 智能体可观测性工具,无需修改代码、无需部署代理、无需介入请求链路,即可从网络数据包中还原智能体的真实行为——工具调用、多步规划、时间消耗、循环陷阱、调用链路一目了然。

产品亮点

  • 零侵入部署:无需 SDK、无需反向代理、不驻留在请求路径上,从网络层被动捕获流量,观测系统故障不影响业务调用
  • 智能体行为还原:自动识别 Claude Code、OpenAI Codex、Hermes、OpenClaw 等主流智能体协议,将多轮工具调用组装为可追踪的单一回合(turn)
  • 全量请求解析:捕获完整的请求与响应体,支持 OpenAI、Anthropic、Azure OpenAI、Gemini、vLLM、Ollama 等主流 LLM 服务商
  • Rust 高性能核心:基于 libpcap、eBPF 和零拷贝技术实现微秒级包处理,单节点可承载高并发流量分析
  • 实时指标聚合:内置 TTFT(首 token 时间)、E2E 端到端延迟、TPOT(输出 token 间隔)、缓存命中率等 8 项关键运营指标
  • 灵活数据存储:默认 DuckDB 嵌入式存储,可选 PostgreSQL + TimescaleDB 或 ClickHouse 应对高吞吐场景
  • 训练数据导出:一键导出 SFT 轨迹数据(JSONL 格式),支持工具调用、推理过程、会话历史的结构化提取

应用场景

  • 生产环境智能体监控:当智能体在纸面上运行良好却在生产环境频繁超时、循环调用、隐式降级时,Heron 从网络层还原真实执行路径,快速定位 planner 循环、工具阻塞、模型替换等根因
  • 性能优化与成本分析:通过 token 吞吐量、缓存命中率、调用速率等指标,识别慢查询、冗余调用和成本异常,支撑容量规划与模型选型决策
  • 安全审计与合规溯源:留存完整的请求响应记录,满足金融、医疗等行业的审计要求,支持按会话、回合、工具调用多维度的行为追溯
  • 智能体训练数据构建:将生产环境的真实交互轨迹导出为标准 JSONL 格式,直接用于监督微调(SFT)和强化学习的数据准备
  • 多云混合架构观测:通过 cloud-probe 从 SPAN/TAP 镜像点接收流量,统一观测跨云、跨机房的分布式智能体部署

目标受众

Heron 主要面向在生产环境部署 LLM 智能体的技术团队——包括 AI 平台工程师、MLOps 工程师、后端架构师以及关注智能体可靠性和性能优化的工程负责人,特别适用于对系统侵入性敏感、追求零改造接入的企业级用户。