La fatiga de alertas es real — así es como combatirla

Qué causa la fatiga de alertas

- Umbral demasiado sensible. Alertar en cualquier error HTTP individual genera ruido constante. - Sin alertas basadas en síntomas. CPU > 80% rara vez importa. - Duplicación de alertas. Tres monitores separados disparando para el mismo problema.

Ajuste de umbrales

Un buen umbral de alerta se establece a 3–4 desviaciones estándar de tu línea base normal.

Para el tiempo de respuesta: si tu p95 es normalmente 200ms, alertar a 500ms es apropiado.

Alertas basadas en síntomas vs causas

✗ Basada en causas: CPU > 90% ✓ Basada en síntomas: Tasa de error API > 5%

Enrutamiento de alertas al canal correcto

Slack/Discord — SEV2 y menos. Email — resúmenes diarios. SMS — solo para SEV1 con rotación on-call explícita.

Revisión mensual de alertas

1. ¿Cuáles alertas se dispararon con más frecuencia? 2. ¿Qué porcentaje era accionable? 3. ¿Algún incidente real pasó desapercibido?

La fatiga de alertas es real — así es como combatirla

Qué causa la fatiga de alertas

Ajuste de umbrales

Alertas basadas en síntomas vs causas

Enrutamiento de alertas al canal correcto

Revisión mensual de alertas

Uptime Monitoring

Better Stack Alternative

More articles

Eligiendo el canal de alerta correcto: Email vs Slack vs PagerDuty vs SMS

Monitoreo frontend: Real User Monitoring vs pruebas sintéticas

Monitoreando tu pipeline CI/CD: Detectando fallos de despliegue antes de que lleguen a los usuarios