مقالات عملية مرتبة حسب المجال والمستوى، اختر المجال المناسب واقرأ من مستوى مبتدئ إلى محترف.
لو inference الـ Llama 3 70B بياخد 8 ثواني والمستخدم بيقفل التاب، Speculative Decoding بيقطع الزمن للنص بنفس الموديل ونفس الجودة. الفكرة: موديل صغير سريع بيخمّن، موديل كبير بيتأكد بالتوازي. مقال للمحترف بمثال الكاشير للمبتدئ، التعريف العلمي الدقيق للـ acceptance probability من ورقة DeepMind 2023، كود vLLM 0.6+ شغّال، أرقام مقاسة على H100 (24 → 71 توكن/ثانية)، trade-offs الذاكرة والـ batching، وحالات لا تستخدم فيها التقنية أصلاً.
لو تطبيقك بيتقل 80ms كل أسبوع وانت ما تشعرش، السبب مش مهندس عمل غلطة كبيرة، السبب 30 PR كل واحد ضايف ضريبة صغيرة. شرح للمحترف بمثال المطعم للمبتدئ، إعداد Lighthouse CI كامل على GitHub Actions، assertions على LCP و INP و CLS و bundle size، أرقام مقاسة من فريق 12 مطور، trade-offs زمن الـ build و false positives، ومتى لا تستخدمها.
لو الـ RAG بتاعك بيفشل في الأسئلة اللي فيها رقم منتج أو UUID أو اسم خطأ تقني، Dense search لوحده مش كفاية. Hybrid Search بيدمج BM25 مع Embeddings عبر Reciprocal Rank Fusion ويرفع الاسترجاع من 78% لـ 96% على BEIR. مقال للمحترف بمثال أمين المكتبة للمبتدئ، تعريف علمي للـ RRF، كود Python شغّال على rank_bm25 + sentence-transformers، أرقام مقاسة، trade-offs، وحالات لا تستخدمه فيها.
لو cache فيه 100 مليون مفتاح وكل request بيدوّر هل المفتاح موجود قبل ما يروح للـ DB، Bloom filter بيخلّيك تجاوب على السؤال ده في 90 نانو ثانية بـ 114MB رام بدل 4GB. مقال للمستوى المتوسط/المحترف بمثال قائمة الفرح، تعريف علمي دقيق، كود Python و Redis شغّال، أرقام مقاسة، trade-offs، وحالات لا تستخدم فيها.
لو السيرفر بيتجمد عند 300 اتصال متزامن على PostgreSQL، المشكلة مش في الـ DB. كل اتصال جديد بياكل 10MB رام و3-5ms في الـ handshake. PgBouncer بيخلّي 10,000 عميل يستخدموا 100 اتصال DB بسطر إعداد. شرح للمستوى المتوسط/المحترف بمثال السوبر ماركت، الأوضاع الثلاثة (session/transaction/statement)، إعداد شغّال، أرقام مقاسة، trade-offs، وحالات لا يصلح فيها.
لو الـ API بتاعك بيتعرّض لـ 50 ألف طلب في الثانية ومحتاج تمنع زبون واحد من ابتلاع الموارد، Redis SETEX بيكلّفك 1.2 مللي ثانية لكل طلب من round-trip للشبكة. Token Bucket في الذاكرة بينزّل الزمن ده لـ 78 ميكروثانية. مقال للمحترف بمثال ماكينة الكافيه للمبتدئ، تعريف علمي دقيق، كود Python 3.12 شغّال مع threading.Lock، أرقام مقاسة بـ wrk، الفرق بين Token Bucket و Leaky Bucket و Sliding Window، trade-offs، وحالات لا تستخدمه فيها.
لو الـ agent بتاعك بياخد 6 ثواني علشان يجيب الطقس + سعر السهم + ميعاد الميتنج + بيانات العميل + الفاتورة، المشكلة مش الموديل بطيء. المشكلة إنك بتنده الأدوات تسلسلياً بدل ما توازيها. شرح للمحترف بمثال طلب الكافيه للمبتدئ، تعريف علمي لـ disable_parallel_tool_use ودورة الـ tool_use blocks، كود Python شغّال على Anthropic SDK 0.40+، أرقام مقاسة من إنتاج، trade-offs الذاكرة والتكلفة، وحالات لازم تعطّل التوازي فيها.
لو سيرفرك Python بيخزن ملايين الـ instances وبتدفع في AWS فاتورة RAM ضخمة، سطر واحد اسمه __slots__ ممكن يقلل الذاكرة 40-60%. مقال للمحترف بمثال درج المكتب للمبتدئ، تعريف علمي دقيق لـ PyDictObject في CPython، كود Python 3.12 شغّال مع أرقام مقاسة بـ pympler، شرح كسر الـ inheritance الكلاسيكي، trade-offs، وحالات لا تستخدمه فيها.
لو endpoint بياخد 2.4 ثانية والـ APM بيقول DB سليمة وCPU 30%، الزمن المفقود في المسافة بين الـ kernel والـ application thread. eBPF بيريك كل syscall وكل packet بدون restart للتطبيق وبأقل من 1% overhead. مقال للمحترف بمثال sensors المصنع، تعريف علمي دقيق لـ verifier وkprobes وXDP، أوامر bpftrace قابلة للنسخ، أرقام مقاسة من production، trade-offs الصلاحيات، وحالات لا تستخدم فيها eBPF أصلاً.