ہر چھوٹی ٹیم کو جس آن-کال رن بک کی ضرورت ہے
صبح 3 بجے کا واقعہ آپ کے عمل کو سمجھنے کا وقت نہیں ہے۔
ایک ٹھوس واقعہ رسپانس عمل کے لیے آپ کو 50 افراد کی ٹیم کی ضرورت نہیں ہے۔
رن بک کیا ہے (اور کیا نہیں ہے)
رن بک ہر ممکنہ ناکامی کے لیے ٹربل شوٹنگ گائیڈ نہیں ہے۔ یہ کسی واقعے کے پہلے 30 منٹ کے لیے ایک چیک لسٹ ہے۔
5 قدمی واقعہ رسپانس فریم ورک
1. تسلیم کریں (0–2 منٹ) — واقعے کا دعویٰ کریں۔ 2. تشخیص (2–5 منٹ) — کیا ٹوٹا ہے؟ 3. مواصلت (5 منٹ) — اسٹیٹس پیج اپڈیٹ کریں۔ 4. تخفیف (5–30 منٹ) — جلد از جلد کام کرنے کی حالت میں آئیں۔ 5. دستاویز (واقعے کے بعد) — بے الزام پوسٹ مارٹم لکھیں۔
چھوٹی ٹیموں کے لیے شدت کی سطح
SEV1 — پروڈکشن بند ہے۔ آن-کال کو جگائیں۔ SEV2 — کمزور۔ کاروباری اوقات میں سنبھالیں۔ SEV3 — معمولی۔ ٹکٹ بنائیں۔
کسے جگانا ہے اور کب
- آن-کال انجینئر: تمام SEV1/SEV2 کے لیے پہلا جواب دہندہ - انجینئرنگ لیڈ: 30 منٹ میں حل نہ ہو تو اسکیلیٹ کریں
ٹولز اور فوری کمانڈز
git log --oneline -10 origin/main docker compose restart api
فیچر گائیڈ
Uptime Monitoring
AlertsDock gives teams uptime monitoring for websites, APIs, TCP checks, DNS checks, SSL expiry, and fast alert routing without enterprise overhead.
گائیڈ پڑھیںمتبادل صفحہ
Better Stack Alternative
Compare AlertsDock with Better Stack for teams that want a more focused monitoring product covering uptime, cron jobs, status pages, and webhooks.
موازنہ دیکھیںMore articles
Incident Playbooks جو خود بخود چلتے ہیں: runbook سے runtime تک
ایسا runbook لکھنا جسے کوئی رات 3 بجے نہیں پڑھتا بیکار ہے۔ ایسا لکھنا جو monitor کے down ہوتے ہی خود بخود شروع ہو جائے اور ہر قدم لاگ کرے ایک force multiplier ہے۔ یہاں سیکھیں کہ on-call کو تنہا بحران کی بجائے checklist فالو کرنے جیسا کیسے بنائیں۔
CI/CD Pipeline کی مانیٹرنگ: Deploy failures کو صارفین تک پہنچنے سے پہلے پکڑنا
ٹوٹا ہوا deployment pipeline ٹوٹی ہوئی سروس جتنا ہی برا ہے۔
Log Management بغیر پیچیدگی: بڑھتی ٹیموں کے لیے عملی گائیڈ
Logs آپ کے سسٹم میں سب سے تفصیلی سچائی کا ذریعہ ہیں۔ یہ سٹور اور تلاش کرنے میں سب سے مہنگے بھی ہیں۔