Polycrate API 0.11.24¶
Release-Datum: 29. Januar 2026
Typ: Feature Release
Highlights¶
- ✅ SRE/SLA/SLO Framework - Vollständige Integration moderner SRE-Standards mit Error Budget Tracking
- ✅ Observability Metrics - Log & Metrics Accounting pro Organization (VictoriaLogs/VictoriaMetrics)
- ✅ Downtime UI Improvements - Eckige Labels, Timeline-Events, Post-Mortem Direkterstellung
- ✅ Downtime Object Logging - Verbesserte Transparenz bei Downtime-Zugehörigkeit
Artefakte¶
Docker Images¶
Kubernetes Deployment¶
Neue Features¶
SRE/SLA/SLO/SLI Framework¶
Vollständige Integration moderner SRE-Standards in Polycrate API:
| Feature | Beschreibung |
|---|---|
| SLO/SLA Targets | Konfigurierbare Ziele pro Object (Default: 99.9% SLO, 99.0% SLA) |
| Error Budget | Automatische Berechnung und Tracking |
| Criticality | Gewichtung für Aggregation (tier-1 bis tier-4) |
| Conditions | SLO_WARNING, SLO_BREACH, SLA_BREACH |
Scope: Availability wird per AGB auf Object-Level (Endpoint, K8sCluster, K8sApp) berechnet. Workspace und Organization zeigen aggregierte Übersichten.
UI-Integration:
- SLO/SLA Status Box in Endpoint, K8sCluster Detail Views
- Organization SLO Overview Box mit Tracked Objects, At Risk, Breached Counts
- V2 Table Columns für
slo_availability,sla_availability,has_active_downtime
Observability Metrics Monitoring¶
Log- und Metrics-Accounting pro Organization für Billing und Monitoring:
| Metrik | Quelle | Zeiträume |
|---|---|---|
| Log Ingestion | VictoriaLogs | 1h, 24h, 30d |
| Active Metric Series | VictoriaMetrics | Current, Avg 1h, Avg 24h, Avg 30d |
Konfigurierbare Labels in SystemConfig:
VICTORIALOGS_ORG_LABELVICTORIAMETRICS_ORG_LABELVICTORIAMETRICS_IS_CLUSTER(Toggle für API-Pfad)
UI-Integration:
- Charts in Organization Detail (ApexCharts Bar Charts)
- 30d-Werte im Organization Header (neben S3 Storage, LB Traffic)
- V2 Table Columns für alle Billable Values
→ Observability Metrics Spezifikation
Downtime UI Improvements¶
| Feature | Beschreibung |
|---|---|
| Eckige Labels | Alle Labels kantig (kein rounded-*) gemäß UI-Standards |
| State Labels | Konsistente Verwendung des state_label Templatetags |
| Severity in Classification | Severity wird in der Classification Box angezeigt |
Downtime Timeline: Extended Events¶
Die Timeline zeigt jetzt chronologisch sortierte Events:
- Status Changes: Object DOWN/Recovered Events
- Activities: Deployment-relevante Events (ReplicaSet, K8sApp Install/Uninstall)
- Maintenances: Überschneidende Wartungsfenster
- Performance: Timeline wird als JSONField kompiliert (
_compile_timeline())
Post-Mortem Notes: Direct Creation¶
Der "Create Post-Mortem Note" Button erstellt direkt eine Note ohne Modal:
- Automatische Erstellung mit vordefinierten Werten
- User-Zuweisung automatisch
- Sofortige Weiterleitung zur Note-Detailseite
Downtime Object Logging¶
Verbesserte Logging-Transparenz für Downtime-Zugehörigkeit:
| Event | Log-Message |
|---|---|
| Object → Downtime zugeordnet | INFO: Added to downtime: {name} |
| Object → Downtime entfernt | INFO: Recovered from downtime: {name} |
| Status-Wechsel während Downtime | INFO: Status changed from X to Y while in downtime: {name} |
Downtime Notification Improvements¶
| Feature | Beschreibung |
|---|---|
| Markdown-Links | Downtime-Name und Objects als Links |
| SLA-Info | counts_towards_sla, excluded_reason in Resolved |
| Skip bei 0 Objects | Keine Notification ohne betroffene Objects |
| Redundanz entfernt | "Downtime Alert", "View Downtime" etc. entfernt |
SystemConfig Erweiterungen¶
Neue konfigurierbare Einstellungen:
| Key | Default | Beschreibung |
|---|---|---|
VICTORIALOGS_ORG_LABEL | organizations.polycrate.io/name | Label für Org-Filterung in VictoriaLogs |
VICTORIAMETRICS_ORG_LABEL | customer | Label für Org-Filterung in VictoriaMetrics |
VICTORIAMETRICS_IS_CLUSTER | true | Cluster vs Single-Node API-Pfad |
DEFAULT_SLO_TARGET | 99.9 | Standard SLO-Ziel (%) |
DEFAULT_SLA_TARGET | 99.0 | Standard SLA-Ziel (%) |
DEFAULT_SLO_WINDOW_DAYS | 30 | SLO-Berechnungszeitraum |
DEFAULT_SLA_WINDOW_DAYS | 30 | SLA-Berechnungszeitraum |
ERROR_BUDGET_WARNING_THRESHOLD | 50 | Warnung ab X% Budget verbraucht |
ERROR_BUDGET_CRITICAL_THRESHOLD | 90 | Kritisch ab X% Budget verbraucht |
Migration¶
Diese Version enthält neue Migrationen:
Neue Felder:
ManagedObject:slo_target,sla_target,slo_availability,sla_availability,criticalityOrganization:observability_metricsJSONFieldDowntime:timelineJSONField
Upgrade¶
# Via Polycrate Block
polycrate pull cargo.ayedo.cloud/ayedo/k8s/polycrate-api
polycrate run polycrate-api install
# Oder direkt via Docker
docker pull cargo.ayedo.cloud/polycrate/polycrate-api:0.11.24
Ausblick (0.12.0)¶
Die nächste Version wird enthalten:
- RocketChat Integration - Automatische Channel-Erstellung pro Organization
- Unified APM Credential - Ein Credential für Metrics, Logs & Traces
- Domains & DNS - Multi-Provider Domain Registration