مقالات عملية مرتبة حسب المجال والمستوى، اختر المجال المناسب واقرأ من مستوى مبتدئ إلى محترف.
لو كل deploy بيخلي فريقك يقعد يراقب Grafana ويضغط rollback يدوي، Flagger بيدخّل 5% ترافيك بس ويراجع metrics تلقائيًا. لو حاجة اتكسرت يرجّع للـ primary في أقل من دقيقة. إعداد عملي بـ YAML شغّال وأرقام إنتاج حقيقية.
لو CI بيفشل ومش قادر تعيد الفشل محليًا، المشكلة في الـ pipeline مش في الكود. Dagger بيكتب الـ CI كود حقيقي يشتغل بنفس الشكل على جهازك وفي GitHub Actions، بيوفر 35 دقيقة debug أسبوعيًا ويقلل runner minutes بنسبة 35%.
لو فريقك بيستلم 40 PR أسبوعيًا من Dependabot بس علشان version bumps، Renovate بيحولهم لـ 5 PRs مجمّعة مع automerge آمن، ودashboard واحد لكل الـ repos. هنا إعداد عملي بقواعد grouping وminimumReleaseAge بتوفر 6-8 ساعات مراجعة في الأسبوع.
لو kubectl delete namespace مسح الإنتاج الساعة 3 الفجر، Velero بيرجّع الـ cluster من S3 في دقايق بدل ساعات. هنا إعداد عملي بـ Kopia وschedule يومي مع أرقام تكلفة وRTO واضحة.
لو عندك AWS keys محفوظة في GitHub Secrets، فأنت شايل سر طويل العمر بلا داعي. هنا إعداد عملي لـ OIDC يقلل المخاطرة ويخلي كل تشغيل يحصل على صلاحية مؤقتة ومحدودة.
لو فريقك بيشغل Terraform من أكثر من CI runner، قفل الـ state يمنع apply مزدوج يبوظ البنية. هنا إعداد عملي لاستخدام S3 lockfile بدل DynamoDB مع trade-offs واضحة.
لو فاتورة EC2 بتتخطى 8000 دولار شهريًا وأغلب الـ nodes شغالة على 30% من قدرتها، المشكلة في حجم الـ nodes مش عددها. Karpenter بيوفر بين 30% و 50% مقابل Cluster Autoscaler. شرح بمثال مطعم، YAML شغّال، وأرقام إنتاج حقيقية.
لو التطبيق بيحتاج 25 ثانية يبدأ، livenessProbe غلط ممكن يدخله في restart loop. هنا إعداد عملي يفرق بين startup وreadiness وliveness بأرقام واضحة.
لو أي تعديل يدوي في Kubernetes بيكسر ما هو موجود في Git، Argo CD self-heal يرجع الحالة المطلوبة تلقائيًا. هنا إعداد عملي بالأرقام والـ trade-offs.