DevOps بالعربي

مقالات عملية مرتبة حسب المجال والمستوى، اختر المجال المناسب واقرأ من مستوى مبتدئ إلى محترف.

محترف25 مايو 2026

Karpenter للمحترف: استبدل Cluster Autoscaler ووفّر 38% من فاتورة EC2 على EKS

لو فاتورة EKS بتاعتك بتعدّي $14K شهرياً و Cluster Autoscaler بياخد 4 دقائق علشان pod واحد pending يقعد، Karpenter v1.0 بيشيل طبقة الـ Node Groups بالكامل ويختار instance type مناسب من ~700 SKU لحظياً. مقال للمحترف بمثال مدير المطعم للمبتدئ، إعداد NodePool و EC2NodeClass كامل على EKS 1.30، أرقام مقاسة من cluster بـ 142 microservice (التوفير 38%، Spot coverage من 22% لـ 68%، scheduling من 247s لـ 52s)، 4 trade-offs خفية، ومتى Karpenter يبقى مبالغة هندسية.

7 دقائق قراءة

محترف24 مايو 2026

KEDA للمحترف: Autoscale Kubernetes حسب Kafka Lag بدل CPU في 18 سطر YAML

لو HPA بيـ scale خدمتك على CPU وعندك Kafka consumer بيتراكم عنده 180 ألف رسالة لأن CPU واقف عند 35%، الـ HPA مش هيتحرك. KEDA بيوصّل decision الـ scaling بمصدر الحدث الفعلي. مقال للمحترف بمثال محل البيتزا للمبتدئ، شرح علمي للـ external metrics من توثيق Kubernetes 1.32 و CNCF، ScaledObject YAML شغّال على EKS 1.30، أرقام مقاسة من فريق بـ 22 microservice (lag من 184K لـ 320، فاتورة EC2 نزلت 41%)، 4 trade-offs خفية، ومتى KEDA يكون قرار غلط.

8 دقائق قراءة

محترف17 مايو 2026

Istio Traffic Splitting للمحترف: Canary Deployment بـ 14 سطر YAML بدون CI/CD معقّد

لو فريقك بيـ deploy نسخة جديدة على 100% من المستخدمين دفعة واحدة، أول bug في query بيكلّفك 100% من الترافيك. Istio VirtualService بـ 14 سطر YAML بيوزّع 5% من الطلبات على الإصدار الجديد ويتركك تشوف P95 ومعدل الأخطاء قبل ما تتقدّم. مقال للمحترف بمثال مطعم البرجر الجديد للمبتدئ، شرح علمي للـ weighted routing من توثيق Istio 1.24، VirtualService و DestinationRule كاملين شغّالين على EKS 1.30، أرقام مقاسة على cluster فيه 14 microservice (نسبة الـ rollback اتنزّلت من 18% لـ 1.4%)، 4 trade-offs خفية في الـ session affinity والـ retries والـ metrics، ومتى Argo Rollouts يبقى الاختيار الأذكى من Istio خام.

6 دقائق قراءة

محترف11 مايو 2026

eBPF و bpftrace للمحترف: راقب latency أي عملية في إنتاجك بدون تعديل سطر كود

لو خدمة في الإنتاج بقت بطيئة فجأة وفريقك بيقول "محتاجين نضيف tracing"، ده معناه أسبوع شغل وزيادة 8% latency على الـ hot path. eBPF و bpftrace بيدّوك نفس الإجابات في 4 سطور shell بدون restart وبدون deploy. مقال للمحترف مع مثال PostgreSQL مقاس على إنتاج بـ 14K req/s، شرح علمي للـ verifier من kernel docs، 4 trade-offs خفية، ومتى eBPF يكون الاختيار الغلط.

7 دقائق قراءة

محترف11 مايو 2026

Karpenter للمحترف: نزّل فاتورة EKS 62% ببديل ذكي لـ Cluster Autoscaler

لو فاتورة EKS بتعدّي 4,200$ شهرياً وعندك Cluster Autoscaler شغّال، انت بتدفع ضريبة scheduler بطيء وغير اقتصادي. Karpenter بياخد قرار scale-up في 38 ثانية بدل 4 دقايق، ويختار instance types بسعر spot الأنسب لكل workload تلقائياً. مقال للمحترف بمثال المطعم بالطاولات المتغيرة، تعريف من توثيق Karpenter v1 وAWS re:Invent 2023، NodePool YAML شغّال على EKS 1.30، أرقام مقاسة من 18 شهر إنتاج (الفاتورة 4,280$ → 1,632$، Spot من 12% لـ 68%)، 4 trade-offs خفية، ومتى Karpenter يكون اختيار غلط.

5 دقائق قراءة

محترف10 مايو 2026

Outbox Pattern للمحترف: امنع رسائل ضايعة بين Postgres و Kafka

لو تطبيقك بيكتب على PostgreSQL وبيبعت لـ Kafka في نفس الـ handler، فيه احتمال 0.4% إن الـ DB يـ commit والرسالة تضيع. على 4M طلب يوميًا ده 16,000 رسالة ضايعة. Outbox Pattern بـ 40 سطر بيقفل الفجوة دي بضمان رياضي. مقال للمحترف بمثال مكتب البريد للمبتدئ، تعريف من Chris Richardson وKleppmann، كود PostgreSQL 16 + Python شغّال مع FOR UPDATE SKIP LOCKED، أرقام مقاسة من إنتاج e-commerce، 4 trade-offs حقيقية، ومتى لا تستخدمه.

7 دقائق قراءة

محترف8 مايو 2026

Distroless Containers للمحترف: شيل bash وapt من الـ image واقطع 87% من ثغرات CVE

لو الـ container بتاعك مبني على node:20 أو python:3.12 الكاملة، فيه عندك 187 ثغرة CVE معروفة و0% منهم ضروري لتشغيل تطبيقك. مقال للمحترف بمثال شنطة المسافر للمبتدئ، تعريف علمي من ورقة Borg EuroSys 2015 ومشروع GoogleContainerTools/distroless، Dockerfile multi-stage شغّال على Node.js 20 و Debian 12، أرقام مقاسة من Skyscanner Engineering و Trivy على 47 خدمة (234 CVE → 18، 0 CRITICAL)، 3 trade-offs حقيقية في debugging و healthcheck و libc، ومتى Distroless تبقى الاختيار الغلط.

6 دقائق قراءة

محترف8 مايو 2026

Falco للمحترف: اكتشف الاختراقات على Kubernetes لحظة حدوثها

لو cluster الإنتاج اتخترق ولقيت الـ logs بعد 6 أيام، الخسارة مش بس بيانات. Falco بـ eBPF بيرصد أي عملية مشبوهة على kernel level لحظة حدوثها بـ overhead 1.4% فقط. مقال للمحترف بمثال إنذار اللص للمبتدئ، تعريف علمي للـ Falco rules engine من توثيق CNCF، YAML شغّال على Falco 0.38 مع Falcosidekick + Slack، أرقام مقاسة من cluster GKE بـ 64 node و 412 pod، 4 trade-offs حقيقية، وحالات لا تستخدم Falco فيها أصلاً.

7 دقائق قراءة

محترف8 مايو 2026

Karpenter للمحترف: استبدل Cluster Autoscaler ووفّر 41% من فاتورة EC2

لو cluster EKS بياكلك $4,200 شهريًا و 38% من الـ nodes فاضية، Cluster Autoscaler مش غلطان — هو بس بيحجز instance type واحد مهما كان حجم الـ pod. Karpenter بيختار EC2 instance بالظبط على مقاس الـ pending pods، يشغّلها في 47 ثانية، ويوفّر 41% من فاتورة EC2 على cluster بـ 60 microservice. مقال للمحترف بمثال موقف العربيات للمبتدئ، تعريف علمي للـ bin-packing من توثيق AWS، YAML شغّال على Karpenter v1.0+، أرقام مقاسة من إنتاج، 4 trade-offs خفية، ومتى ما تستخدمهوش أصلاً.

6 دقائق قراءة