مقالات عملية مرتبة حسب المجال والمستوى، اختر المجال المناسب واقرأ من مستوى مبتدئ إلى محترف.
لو cluster EKS بياكلك $4,200 شهريًا و 38% من الـ nodes فاضية، Cluster Autoscaler مش غلطان — هو بس بيحجز instance type واحد مهما كان حجم الـ pod. Karpenter بيختار EC2 instance بالظبط على مقاس الـ pending pods، يشغّلها في 47 ثانية، ويوفّر 41% من فاتورة EC2 على cluster بـ 60 microservice. مقال للمحترف بمثال موقف العربيات للمبتدئ، تعريف علمي للـ bin-packing من توثيق AWS، YAML شغّال على Karpenter v1.0+، أرقام مقاسة من إنتاج، 4 trade-offs خفية، ومتى ما تستخدمهوش أصلاً.
RollingUpdate العادي بيستبدل الـ pods بدون ما يقيس جودة الإصدار الجديد. Argo Rollouts بيوجّه 5% من الترافيك للإصدار الجديد، يقيس error rate من Prometheus، ويرجع تلقائياً في 47 ثانية لو فيه انحراف. مقال للمحترف بمثال صلصة المطعم للمبتدئ، تعريف علمي للـ progressive delivery، YAML شغّال على Argo Rollouts 1.7 + Istio، AnalysisTemplate مع Prometheus، أرقام مقاسة من cluster بـ 28 microservice (failure rate من 8% إلى 0.7%)، 4 trade-offs حقيقية، ومتى لا تستخدمه أصلاً.
لو 8 microservices بتاكل 24 pod طول اليوم وفيهم 3 بس اللي عنده شغل وقت الذروة، بتدفع لـ idle بنسبة 60%+. KEDA بيربط عدد الـ pods بـ Kafka consumer lag مباشرةً، فبتدفع للشغل الحقيقي بس. شرح للمحترف بمثال العيادة للمبتدئ، تعريف علمي للـ ScaledObject، YAML شغّال على KEDA 2.13، أرقام إنتاج (70% توفير، 3x تحسّن في P99)، trade-offs الـ cold start و rebalance، ومتى لا تستخدم scale-to-zero أصلاً.
لو endpoint بياخد 2.4 ثانية والـ APM بيقول DB سليمة وCPU 30%، الزمن المفقود في المسافة بين الـ kernel والـ application thread. eBPF بيريك كل syscall وكل packet بدون restart للتطبيق وبأقل من 1% overhead. مقال للمحترف بمثال sensors المصنع، تعريف علمي دقيق لـ verifier وkprobes وXDP، أوامر bpftrace قابلة للنسخ، أرقام مقاسة من production، trade-offs الصلاحيات، وحالات لا تستخدم فيها eBPF أصلاً.
لو الـ API بيرد في 1.4 ثانية وكل metric مطمئنة، الزمن الضائع موجود في span واحد بين خدمتين. OpenTelemetry بيرسم الطلب كـ waterfall كامل عبر الـ microservices بسطر instrumentation واحد. شرح للمحترف بمثال شركة الشحن، تعريف علمي لـ trace/span/context propagation، كود Node.js شغّال، إعداد Jaeger، أرقام إنتاج (1.4s → 380ms)، trade-offs الـ overhead والـ sampling، ومتى لا تستخدمه أصلاً.
لو CI/CD pipeline بتاعك بيستخدم actions/checkout@v4، اعرف ليه السطر ده mutable وإزاي حادثة tj-actions في مارس 2025 سرّبت secrets آلاف الريبوهات. مقال للمحترف بمثال للمبتدئ، تعريف SHA-1 العلمي، YAML قابل للنسخ، إعداد Renovate، أرقام، trade-offs، وحالات لا تطبّقه فيها.