İzleme (Monitoring)
Platform, izleme için Prometheus (metrikler), Loki (loglar) ve Jaeger (trace) yığınını kullanır. Tüm veriler Grafana üzerinden görselleştirilir.
İzleme Mimarisi
Dört bileşenli izleme altyapısı: veri toplama, görselleştirme, uyarı ve kaynak sistemler.
Metrikler
| Kategori | Metrik | Açıklama |
|---|---|---|
| API | request_count | Toplam istek sayısı |
| API | response_time | Tepki süresi |
| Agent | credential_issued | Düzenlenen credential sayısı |
| Agent | proof_verified | Doğrulanan ispat sayısı |
| Sistem | cpu_usage | CPU kullanımı |
| Sistem | memory_usage | Bellek kullanımı |
Dashboard'lar
| Dashboard | Görüntülenen Metrikler |
|---|---|
| Platform Genel Bakış | Toplam aktif bağlantı, günlük credential sayısı, ispat doğrulama oranı, sistem sağlık durumu |
| API Performansı | Saniye başına istek (RPS), ortalama tepki süresi, P95/P99 gecikmesi, hata oranı (%) |
| Agent Aktivitesi | Credential düzenleme sayısı, ispat doğrulama sayısı, aktif bağlantı sayısı, mediator kuyruk derinliği |
| Altyapı | CPU/Bellek kullanımı, pod durumları, disk I/O, ağ trafiği |
Dashboard Erişimi
Tüm dashboard'lara https://grafana.example.com adresi üzerinden Grafana ile erişilebilir.
Uyarı Kuralları
| Uyarı | Koşul | Önem Derecesi |
|---|---|---|
| HighErrorRate | error_rate > %5 | Kritik |
| HighLatency | p99 > 500ms | Uyarı |
| PodCrashLoop | restart_count > 3 | Kritik |
| DiskSpaceLow | disk_usage > %85 | Uyarı |
| AgentUnhealthy | health_check fail | Kritik |
Log Yapısı
| Alan | Açıklama |
|---|---|
timestamp | ISO8601 zamanı |
level | Log seviyesi |
service | Servis adı |
trace_id | Dağıtık izleme ID'si |
message | Log mesajı |
metadata | Ek bilgiler |