Alert-Müdigkeit ist real — So bekämpfen Sie sie
Ihr On-Call-Ingenieur hat diese Woche 47 Alarme erhalten. 44 davon lösten sich selbst. 2 waren Falsch-Positive. 1 war real.
Wenn alles kritisch ist, ist nichts kritisch. Lernen Sie, Ihre Alert-Schwellenwerte zu tunen und Rauschen zu reduzieren.
Was Alert-Müdigkeit verursacht
- Schwellenwert zu empfindlich. Alarmierung bei einzelnen HTTP-Fehlern erzeugt konstantes Rauschen. - Keine symptombasierte Alarmierung. CPU > 80% ist selten wichtig. - Alert-Duplizierung. Drei separate Monitore feuern für dasselbe zugrunde liegende Problem.
Schwellenwert-Tuning
Ein guter Alert-Schwellenwert wird bei 3–4 Standardabweichungen vom normalen Basislinienwert gesetzt.
Für Antwortzeit: Wenn Ihr p95 normalerweise 200ms ist, ist Alarmierung bei 500ms angemessen.
Symptom- vs. ursachenbasierte Alarmierung
✗ Ursachenbasiert: CPU > 90% ✓ Symptombasiert: API-Fehlerrate > 5%
Alerts an den richtigen Kanal weiterleiten
Slack/Discord — SEV2 und darunter. E-Mail — tägliche Digests. SMS — nur für SEV1 mit expliziter On-Call-Rotation.
Monatliche Alert-Überprüfung
1. Welche Alerts wurden am häufigsten ausgelöst? 2. Wie viel Prozent waren umsetzbar? 3. Gingen echte Vorfälle unentdeckt?
Feature-Leitfaden
Uptime Monitoring
AlertsDock gives teams uptime monitoring for websites, APIs, TCP checks, DNS checks, SSL expiry, and fast alert routing without enterprise overhead.
Leitfaden lesenAlternativseite
Better Stack Alternative
Compare AlertsDock with Better Stack for teams that want a more focused monitoring product covering uptime, cron jobs, status pages, and webhooks.
Vergleich ansehenMore articles
Den richtigen Alarmierungskanal wählen: E-Mail vs Slack vs PagerDuty vs SMS
Die richtige Warnung zur falschen Zeit über den falschen Kanal ist genauso schlimm wie gar keine Warnung.
Frontend-Monitoring: Real User Monitoring vs Synthetic Testing
Backend-Uptime-Checks verpassen den Browser. Real User Monitoring zeigt, was echte Nutzer erleben.
CI/CD-Pipeline überwachen: Deploy-Fehler abfangen bevor sie Nutzer erreichen
Eine defekte Deployment-Pipeline ist genauso schlimm wie ein defekter Service.