हेरन (Heron) — नेटवर्क वायर से एजेंट ऑब्जर्वेबिलिटी
हेरन एक पैसिव एनालाइज़र है जो नेटवर्क वायर पर LLM ट्रैफिक को देखता है और पुनर्निर्माण करता है कि आपके एजेंट वास्तव में क्या कर रहे हैं — टूल कॉल, मल्टी-स्टेप प्लान, समय कहाँ जाता है, लूप कहाँ होते हैं, कौन किसे कॉल करता है। कोई SDK नहीं, कोई साइडकार नहीं, रिक्वेस्ट पाथ में कोई प्रॉक्सी नहीं।
उत्पाद विशेषताएं
- पैसिव मॉनिटरिंग: नेटवर्क वायर से सीधे ट्रैफिक कैप्चर, एप्लिकेशन कोड में कोई बदलाव नहीं
- एजेंट-अग्नोस्टिक: Claude Code, OpenAI Codex, Hermes, OpenClaw और कस्टम एजेंट्स के लिए बिल्ट-इन सपोर्ट
- टर्न एंड सेशन ऑर्गनाइजेशन: रॉ HTTP कॉल के बजाय एजेंट की पूरी बातचीत को एक पता योग्य टर्न में सिलाई
- ऑफ-पाथ आर्किटेक्चर: ऑब्जर्वर फेल होने पर भी कॉल टूटते नहीं, प्रोडक्शन में शून्य रिस्क
- रस्ट में लिखा: फुल रिक्वेस्ट और रिस्पांस बॉडीज़ के साथ हाई-परफॉर्मेंस पार्सिंग
- ** flexible स्टोरेज**: DuckDB डिफॉल्ट, PostgreSQL + TimescaleDB या ClickHouse विकल्प
उपयोग के मामले
- प्रोडक्शन डिगिंग: जब लॉग्स 200 OK दिखाते हैं पर रन 9 सेकंड और तीन रीट्राई लेता है, तो प्लानर लूप और स्टॉल्ड टूल कॉल का पता लगाएं
- परफॉर्मेंस ऑप्टिमाइजेशन: TTFT, E2E लेटेंसी, TPOT, टोकन थ्रूपुट — असली मेट्रिक्स जिन पर ऑप्स, डेव और बिजनेस ध्यान देते हैं
- SFT ट्रेनिंग डेटा निर्माण: टर्न्स और सेशंस को messages JSONL में एक्सपोर्ट करें, टूल कॉल और रिजल्ट्स को रिहाइड्रेटेड ऑब्जेक्ट्स के साथ
- क्लाउड-नेटिव ऑब्जर्वेबिलिटी: ZMQ क्लाउड-प्रोब, eBPF SSL uprobes, और SPAN/TAP होस्ट्स के लिए सपोर्ट
लक्षित दर्शक
मशीन लर्निंग इंजीनियर्स, DevOps टीमें, और LLM एजेंट्स को प्रोडक्शन में डिप्लॉय करने वाली कंपनियां जिन्हें SDK इंस्ट्रूमेंटेशन या प्रॉक्सी के बिना गहरी ऑब्जर्वेबिलिटी चाहिए।