مقالات عملية مرتبة حسب المجال والمستوى، اختر المجال المناسب واقرأ من مستوى مبتدئ إلى محترف.
لو Redis cluster بتاعك بـ 4 سيرفرات وضفت سيرفر خامس بـ hash(key) % N، 80% من المفاتيح بتنتقل والـ cache بيبرد فجأة. Consistent Hashing بينزّل النسبة دي لأقل من 2%. مقال للمستوى المتوسط بمثال الفندق للمبتدئ، تعريف علمي من ورقة Karger 1997 (MIT)، كود Python في 50 سطر مع Virtual Nodes، أرقام مقاسة على 10 مليون مفتاح، 4 trade-offs حقيقية، وحالات لا تستخدمها فيها مع المصادر الرسمية.
لو الـ cache cluster بتاعك بيقع كل ما تضيف سيرفر جديد لأن hash(key) % N بيغيّر مكان كل المفاتيح، Consistent Hashing بيخلّي 2% بس من المفاتيح تتنقل بدل 98%. شرح للمحترف بمثال موزّع البريد للمبتدئ، تعريف علمي دقيق من ورقة Karger 1997، كود Python شغّال يقيس الفرق فعليًا، فكرة virtual nodes ومتى تحتاج 150 vnode لكل سيرفر، أرقام مقاسة، trade-offs، والحالات اللي ما تستخدمهوش فيها.
لو بتأجّل deploy ليلة الجمعة لأن الـ rollback مكلف، Feature Flags بتنزّل rollback من 45 دقيقة لـ 3 ثواني. مقال للمتوسط بمثال مفتاح الكهربا للمبتدئ، تعريف علمي للأنواع الأربعة من Pete Hodgson، كود Express + PostgreSQL شغّال في 100 سطر مع gradual rollout بـ sha1 bucketing، أرقام مقاسة من فريق 12 مهندس، 4 trade-offs حقيقية، ومتى لا تستخدمها أصلاً.
لو SELECT بسيط على جدول مليون صف بياخد 8 ثواني، المشكلة مش في السيرفر. الـ Index بسطر SQL واحد بينزّل الزمن لـ 5ms، 1690x أسرع. شرح للمبتدئ بمثال القاموس، تعريف علمي للـ B-tree، كود PostgreSQL 16 شغّال مع EXPLAIN ANALYZE، أرقام مقاسة، 3 trade-offs حقيقية (مساحة، بطء الكتابة، صيانة)، 4 حالات Index بيشتغل فيها وحالات بيفشل، ومتى ما تستخدمش Index أصلاً.
لو Llama 3 70B عندك بيولّد 32 توكن/ثانية على A100، الـ GPU مش مشغول حسابيًا. المشكلة memory bandwidth، والحل اسمه Speculative Decoding بيرفع المعدل لـ 91 توكن/ثانية بدون تغيير في الموديل ولا خسارة جودة. مقال للمحترف بمثال لجنة المراجعة للمبتدئ، تعريف علمي من ورقة Leviathan ICML 2023، كود vLLM 0.7+ شغّال، أرقام مقاسة من إنتاج، 4 trade-offs، وحالات لا تستخدمه فيها أصلاً.
تدريب كامل لـ Llama 3 8B بيحتاج 320GB ذاكرة GPU وسيرفر بـ$60,000. LoRA بيدرّب نفس الموديل في 6 ساعات على RTX 4090 واحدة بـ 16GB، بفقد جودة 1-2% بس. مقال للمتوسط بمثال محرر الكتاب للمبتدئ، تعريف علمي للـ low-rank decomposition من ورقة Hu et al. 2021، كود PEFT + QLoRA شغّال، أرقام مقاسة على 12,000 مثال عربي، 4 trade-offs، ومتى لا تستخدم LoRA أصلاً.
دليل عملي للمستوى المتوسط لتفعيل HTTP/3 و QUIC على NGINX 1.25 وقطع زمن التحميل بنسبة 35% على شبكات 4G ضعيفة. شرح Head-of-Line Blocking بمثال طابور الكاشير، تعريف علمي من RFC 9000 و RFC 9114، 6 خطوات قابلة للنسخ مع كود NGINX و sysctl، أرقام مقاسة من Cloudflare على 25 مليون طلب يومي، 4 trade-offs حقيقية، وحالات لا تستخدم HTTP/3 فيها مع المصادر الرسمية.
Llama 3 70B بصيغته الأصلية يحتاج 140GB ذاكرة وسيرفر بـ$30,000. الـ Quantization بيضغط أوزان الموديل من FP16 لـ INT4 ويخلّيه يشتغل على لابتوب 16-32GB RAM مع خسارة دقة 3-5% فقط. مقال للمتوسط بمثال ضغط الصور للمبتدئ، تعريف علمي للـ scale و zero-point، كود llama.cpp شغّال، أرقام مقاسة من ورقة GPTQ، 4 trade-offs حقيقية، وحالات ما تستخدمش الـ quantization فيها.
سكربت bash بسيط بـ pg_dump و aws-cli وsystemd timer يعمل نسخة احتياطية يومية لقاعدة البيانات على S3 في حساب منفصل، مع خطة استرجاع مُختبرة بتشتغل في أقل من 4 دقايق على DB حجمها 8GB. دليل عملي للمبتدئ مع الكود الكامل، تكلفة شهرية محسوبة، ومتى لا تستخدم هذه الطريقة أصلاً.