Heron
Heronは、ネットワーク上のLLM通信を受動的に監視し、エージェントの実際の動作を再構成する観測性ツールです。SDKやプロキシ、サイドカーを必要とせず、通信経路上に設置することなく、ツール呼び出しからマルチステップ計画、時間の消費所、ループ発生箇所、呼び出し関係までを可視化します。Rustで書かれた軽量な実装により、本番環境への影響をゼロに保ちながら、エージェントの「見えない」動作を明らかにします。
製品のハイライト
- 受動的キャプチャ: リクエスト経路上に介入せず、libpcapまたは.pcapファイルからLLM通信を解析
- エージェントターンの自動再構成: プランナー→ツール→プランナーの複数呼び出しを単一のアドレス可能なターンとして統合
- フレームワーク非依存: Claude Code、Codex、Hermes、OpenClaw、カスタムエージェントに対応し、SDK不要で動作
- リアルタイムメトリクス: TTFT、E2Eレイテンシー、TPOT、トークンスループット、キャッシュヒット率など8種類の主要指標をスライディングウィンドウで集計
- 柔軟なストレージ: DuckDB(デフォルト)、PostgreSQL/TimescaleDB、ClickHouseから選択可能
- SFTデータエクスポート: ターンとセッションをJSONL形式で学習データとして出力可能
ユースケース
- 本番環境の異常検知: ツール呼び出しの停滞、プランナーの状態ループ、ダウンストリームのモデル置き換えなど、ログでは見えない問題を特定
- マルチステップエージェントのデバッグ: 複数回のAPI呼び出しを論理的なターンとして再構成し、エージェントの意思決定フローを追跡
- レイテンシー最適化: TTFT、E2E、TPOTなどの詳細なタイミング指標に基づき、ボトルネックを特定して性能を改善
- 学習データ生成: 実際のエージェント実行ログから教師ありファインチューニング用の軌跡データを抽出
対象ユーザー
LLMエージェントを本番運用しているSRE、MLエンジニア、プラットフォームチーム向け。特にSDK導入やプロキシ変更が困難な既存システムにおいて、非侵襲的な観測性を求める組織に最適です。