Retrace — AIエージェントのための実行リプレイエンジン
AIエージェントの動作を記録・再生・分岐させることで、開発チームは失敗の根本原因に到達し、修正を検証してから本番デプロイを行えます。Retraceは「CI for AI agent behavior」を実現し、従来のオブザーバビリティツールでは不可能だった、エージェントの再実行による確実な品質保証を提供します。
製品のハイライト
- ワンライン計装: Python/TypeScriptに1つのデコレータを追加するだけで、OpenAI・Anthropic・GeminiなどあらゆるLLMとフレームワークに対応。インフラ管理不要で即座にトレースが開始されます
- フォーク&リプレイ: 失敗したステップから分岐して再実行し、プロンプト・ツール入力・モデルの変更を即座に検証。原因と症状の分離を実現します
- ランタイムガードレール: 予算・ループ・ステップ数の制限を超えた際に自動停止。承認待ちゲートウェイで不適切なアクションを事前ブロックし、クラウド請求の暴走を防ぎます
- 証明可能な修正: 失敗した実行に対して修正を再実行し、「改善・劣化・変化なし」の判定を取得。リリース前に品質を保証します
- CI統合による回帰テスト: 本番の失敗を永続的な回帰テストに変換し、PRごとに評価ゲートを実行。ビルド失敗によって問題のある変更を本番到達前に阻止します
ユースケース
- インシデント対応の自動化: RCA(根本原因分析)エージェントがOOM症状で停止した場合、該当ステップからフォークしてバッチサイズ50倍のデプロイが原因であることを特定し、修正を検証
- プロンプトエンジニアリングの効率化: マルチステップエージェントの特定ステップでプロンプトを変更し、後続のツール呼び出しまで含めて副作用を確認してから本番適用
- マルチエージェントシステムの可視化: planner → researcher → writer といったエージェント間の連携をセッション・トポロジー・メモリで追跡し、連携失敗のブラックボックスを解消
- コスト管理と異常検知: 統計的ドリフト・忠実度低下・MAST型障害を自動フラグ。予算超過前に実行を停止し、予期せぬ高額請求を防止
対象ユーザー
AIエージェントを本番運用する開発者・MLエンジニア・プロダクトチームで、従来のログ監視では不十分な「再現性のあるデバッグ」と「修正の証明」を求めている組織に最適です。LangChain・CrewAI・LlamaIndexなど既存フレームワークを活用しつつ、エージェントの信頼性をCI/CDパイプラインに組み込みたいチーム向けのソリューションです。