مقالات عملية مرتبة حسب المجال والمستوى، اختر المجال المناسب واقرأ من مستوى مبتدئ إلى محترف.
لو سألت ChatGPT أو Claude مسألة حسابية بسيطة ولقيته بيرد بإجابة غلط بثقة، انت مش محتاج تغيّر النموذج. جملة سحرية واحدة «فكّر خطوة بخطوة» بترفع الدقة على GSM8K من ٣٢.٦٪ لـ ٧٩.٥٪ بدون fine-tuning. مقال للمبتدئ بمثال طالب الرياضيات في الفصل، شرح علمي من ورقة Wei et al. 2022 (Google Research)، كود Python في ١٨ سطر شغّال على Claude Sonnet 4.6 و anthropic SDK 0.49+، أرقام مقاسة على ٢٠٠ سؤال حسابي عربي، ٤ trade-offs خفية، ومتى Chain of Thought بيكون مضيعة tokens.
لو شريط البحث في موقعك بيرسل request لكل حرف، انت بتدفع تكلفة 700× اللي محتاجها. سطور JavaScript بـ debounce بينزّلوا الطلبات من 8400 لـ 12 في الدقيقة. مقال للمبتدئ بمثال البقّال، فرق debounce vs throttle، كود شغّال على JS الخالص، أرقام مقاسة من e-commerce عربي، 4 trade-offs خفية، ومتى debounce مضيعة وقت.
لو الـ /checkout بقى بطيء وعندك 8 microservices، تدور المشكلة في logs 8 خدمات يأخد ساعتين. OpenTelemetry بـ 12 سطر إعداد بيوريك الطلب كامل في Jaeger، وبيقلّل زمن التشخيص من 142 دقيقة لـ 9 دقائق. مقال للمتوسط بمثال شركة الشحن للمبتدئ، شرح علمي من Google Dapper Paper (Sigelman 2010) و CNCF OpenTelemetry Spec، كود Python شغّال على opentelemetry-sdk 1.27، أرقام مقاسة من 14 microservice في e-commerce عربي بـ 38K طلب/يوم، 4 trade-offs خفية، ومتى Tracing بيكون مبالغة هندسية.
لو بتدفع $4,800 شهرياً في inference Llama 3.1 70B على H100 وبتشتكي إن الـ TPS واقفة عند 42 توكن/ثانية لكل مستخدم، المشكلة مش في الـ GPU. Speculative Decoding بيخلّي نموذج 3B يقترح ونموذج 70B يتحقق بالتوازي، فيقفز TPS لـ 113 (2.7×) بنفس الـ logits بالظبط. دليل للمحترف بمثال الصحفي والمُحرر، شرح علمي من ورقة Leviathan 2023 (Google Research)، إعداد vLLM 0.6.5 شغّال، أرقام مقاسة (acceptance rate 0.74، latency من 510ms لـ 190ms)، 4 trade-offs خفية، ومتى Speculation overhead بدون فايدة.
لو الـ web crawler عندك بيعمل DB query لكل URL جديد علشان يتأكد إنه ما اتزارش، انت بتدفع 4ms في كل lookup. Bloom Filter بيوفّر 99.07% من الـ queries في 64MB RAM، مع 0.93% false positive rate فقط، مقاس على 50 مليون URL من Common Crawl.
لو بتشغّل Llama 3.1 70B على H100 ومحتاج تنزّل الـ latency تحت 500ms للمستخدم، Speculative Decoding بيرفع الـ throughput من 24 إلى 58 token/sec بنموذج draft صغير. مقال للمحترف بمثال المحرر والمدقق اللغوي للمبتدئ، شرح علمي من ورقة Leviathan 2022 (Google) و Chen 2023 (DeepMind)، إعداد vLLM 0.6.3+ شغّال مع Llama-3.2-1B كـ draft، أرقام مقاسة على workload عربي حقيقي 2,800 طلب، 5 trade-offs خفية، ومتى الـ Speculative Decoding بيكون مضيعة memory.
لو سكربت Python بياكل 47 جيجا رام بسبب list واحدة، Generators بكلمة yield بتنزّل الذاكرة لـ 12 ميجا بدون تغيير في الـ infrastructure. مقال للمتوسط بمثال المكتبة العامة للمبتدئ، شرح علمي من PEP 255 وتوثيق Python 3.13، كود قابل للنسخ، أرقام مقاسة على ملف 50GB، Generator Expressions، Pipeline من 3 generators متربطين، 4 trade-offs خفية، ومتى Generators يكون اختيار غلط.
لو خدمتك بتعمل 18 ألف lookup query في الثانية و87% منهم بيرجّع فاضي، Bloom Filter بـ 1.2MB في الذاكرة بيرفض 99% منهم في 200 نانوثانية قبل ما يلمسوا PostgreSQL. مقال للمحترف بمثال البوّاب للمبتدئ، تعريف من ورقة Bloom 1970 في CACM، الرياضيات الفعلية (m, k, n)، كود Python شغّال على pybloom-live 4.0، أرقام مقاسة على workload فيه 60M lookup/يوم (الفاتورة من 1,840$ لـ 410$، توفير 78%)، 4 trade-offs خفية، ومتى Bloom Filter يبقى اختيار غلط.
لو زرار "Export CSV" في dashboard شركتك بيرجّع 502 بعد 90 ثانية، المشكلة مش في الـ DB — هي إن السيرفر بيحمّل المليون صف كله في الـ RAM. مقال للمبتدئ بمثال نقل خزّان المياه بالدلو، تعريف علمي للـ Streams و Backpressure من توثيق Node.js الرسمي، كود Express + pg-query-stream + csv-stringify كامل في 50 سطر، أرقام مقاسة من fintech مصري على 1.24 مليون صف (RAM من 3.8GB لـ 42MB، الوقت من 92 ثانية لـ 14 ثانية)، 4 trade-offs خفية في Excel limit وأخطاء وسط الملف، ومتى Streams بتكون تعقيد بدون فايدة.