Zum Inhalt

Polycrate API 0.11.24

Release-Datum: 29. Januar 2026
Typ: Feature Release

Highlights

  • SRE/SLA/SLO Framework - Vollständige Integration moderner SRE-Standards mit Error Budget Tracking
  • Observability Metrics - Log & Metrics Accounting pro Organization (VictoriaLogs/VictoriaMetrics)
  • Downtime UI Improvements - Eckige Labels, Timeline-Events, Post-Mortem Direkterstellung
  • Downtime Object Logging - Verbesserte Transparenz bei Downtime-Zugehörigkeit

Artefakte

Docker Images

docker pull cargo.ayedo.cloud/polycrate/polycrate-api:0.11.24

Kubernetes Deployment

polycrate pull cargo.ayedo.cloud/ayedo/k8s/polycrate-api
polycrate run polycrate-api install

Installation & Deployment


Neue Features

SRE/SLA/SLO/SLI Framework

Vollständige Integration moderner SRE-Standards in Polycrate API:

Feature Beschreibung
SLO/SLA Targets Konfigurierbare Ziele pro Object (Default: 99.9% SLO, 99.0% SLA)
Error Budget Automatische Berechnung und Tracking
Criticality Gewichtung für Aggregation (tier-1 bis tier-4)
Conditions SLO_WARNING, SLO_BREACH, SLA_BREACH

Scope: Availability wird per AGB auf Object-Level (Endpoint, K8sCluster, K8sApp) berechnet. Workspace und Organization zeigen aggregierte Übersichten.

UI-Integration:

  • SLO/SLA Status Box in Endpoint, K8sCluster Detail Views
  • Organization SLO Overview Box mit Tracked Objects, At Risk, Breached Counts
  • V2 Table Columns für slo_availability, sla_availability, has_active_downtime

SRE/SLO Spezifikation

Observability Metrics Monitoring

Log- und Metrics-Accounting pro Organization für Billing und Monitoring:

Metrik Quelle Zeiträume
Log Ingestion VictoriaLogs 1h, 24h, 30d
Active Metric Series VictoriaMetrics Current, Avg 1h, Avg 24h, Avg 30d

Konfigurierbare Labels in SystemConfig:

  • VICTORIALOGS_ORG_LABEL
  • VICTORIAMETRICS_ORG_LABEL
  • VICTORIAMETRICS_IS_CLUSTER (Toggle für API-Pfad)

UI-Integration:

  • Charts in Organization Detail (ApexCharts Bar Charts)
  • 30d-Werte im Organization Header (neben S3 Storage, LB Traffic)
  • V2 Table Columns für alle Billable Values

Observability Metrics Spezifikation

Downtime UI Improvements

Feature Beschreibung
Eckige Labels Alle Labels kantig (kein rounded-*) gemäß UI-Standards
State Labels Konsistente Verwendung des state_label Templatetags
Severity in Classification Severity wird in der Classification Box angezeigt

Downtime Timeline: Extended Events

Die Timeline zeigt jetzt chronologisch sortierte Events:

  • Status Changes: Object DOWN/Recovered Events
  • Activities: Deployment-relevante Events (ReplicaSet, K8sApp Install/Uninstall)
  • Maintenances: Überschneidende Wartungsfenster
  • Performance: Timeline wird als JSONField kompiliert (_compile_timeline())

Post-Mortem Notes: Direct Creation

Der "Create Post-Mortem Note" Button erstellt direkt eine Note ohne Modal:

  • Automatische Erstellung mit vordefinierten Werten
  • User-Zuweisung automatisch
  • Sofortige Weiterleitung zur Note-Detailseite

Downtime Object Logging

Verbesserte Logging-Transparenz für Downtime-Zugehörigkeit:

Event Log-Message
Object → Downtime zugeordnet INFO: Added to downtime: {name}
Object → Downtime entfernt INFO: Recovered from downtime: {name}
Status-Wechsel während Downtime INFO: Status changed from X to Y while in downtime: {name}

Downtime Notification Improvements

Feature Beschreibung
Markdown-Links Downtime-Name und Objects als Links
SLA-Info counts_towards_sla, excluded_reason in Resolved
Skip bei 0 Objects Keine Notification ohne betroffene Objects
Redundanz entfernt "Downtime Alert", "View Downtime" etc. entfernt

SystemConfig Erweiterungen

Neue konfigurierbare Einstellungen:

Key Default Beschreibung
VICTORIALOGS_ORG_LABEL organizations.polycrate.io/name Label für Org-Filterung in VictoriaLogs
VICTORIAMETRICS_ORG_LABEL customer Label für Org-Filterung in VictoriaMetrics
VICTORIAMETRICS_IS_CLUSTER true Cluster vs Single-Node API-Pfad
DEFAULT_SLO_TARGET 99.9 Standard SLO-Ziel (%)
DEFAULT_SLA_TARGET 99.0 Standard SLA-Ziel (%)
DEFAULT_SLO_WINDOW_DAYS 30 SLO-Berechnungszeitraum
DEFAULT_SLA_WINDOW_DAYS 30 SLA-Berechnungszeitraum
ERROR_BUDGET_WARNING_THRESHOLD 50 Warnung ab X% Budget verbraucht
ERROR_BUDGET_CRITICAL_THRESHOLD 90 Kritisch ab X% Budget verbraucht

Migration

Diese Version enthält neue Migrationen:

python manage.py migrate

Neue Felder:

  • ManagedObject: slo_target, sla_target, slo_availability, sla_availability, criticality
  • Organization: observability_metrics JSONField
  • Downtime: timeline JSONField

Upgrade

# Via Polycrate Block
polycrate pull cargo.ayedo.cloud/ayedo/k8s/polycrate-api
polycrate run polycrate-api install

# Oder direkt via Docker
docker pull cargo.ayedo.cloud/polycrate/polycrate-api:0.11.24

Ausblick (0.12.0)

Die nächste Version wird enthalten:

  • RocketChat Integration - Automatische Channel-Erstellung pro Organization
  • Unified APM Credential - Ein Credential für Metrics, Logs & Traces
  • Domains & DNS - Multi-Provider Domain Registration

Geplante Features