مقالات ودروس مجانية تساعدك في رحلتك التعليمية — من أساسيات البرمجة إلى أحدث التقنيات.
لو موديل Llama 3.1 70B بيطلب 140GB ذاكرة وعندك GPU واحد بـ 48GB، Quantization بيقطع المتطلبات للربع — 35GB — مع خسارة دقة أقل من 1% على MMLU. مقال للمستوى المتوسط بمثال ضغط الصور للمبتدئ، تعريف علمي للـ AWQ و GPTQ، كود Python شغّال على transformers + AutoAWQ، أرقام مقاسة من ورقة AWQ 2024 و Hugging Face، trade-offs، وحالات لا تستخدم Quantization فيها أصلاً.
لو شغّلت 8 threads في Python على CPU بـ 16 core وفوجئت إن الكود ماتسرّعش بل بطئ، السبب اسمه Global Interpreter Lock. مقال للمحترف بمثال الميكروفون الواحد للمبتدئ، تعريف علمي دقيق لـ CPython وbytecode evaluation، كود Python 3.12 شغّال يقيس الفرق بين threading و multiprocessing، أرقام مقاسة فعلياً، نظرة على PEP 703 وفكرة free-threaded Python، trade-offs واضحة، وحالات يبقى فيها threading منطقي رغم الـ GIL.
لو حاولت تشغّل Llama 3.1 70B لقيت إنه محتاج 140GB ذاكرة و4 كروت A100. NF4 Quantization بينزّله لـ40GB وA100 واحد بفقد 0.5% فقط في MMLU. مقال للمتوسط بمثال ضغط الصورة من 16 مليون لون لـ256، شرح علمي للـNormalFloat 4 من ورقة Tim Dettmers (NeurIPS 2023)، كود Python شغّال على bitsandbytes + transformers، أرقام مقاسة (perplexity, MMLU, tok/s)، 4 trade-offs حقيقية، وحالات لازم تتجنّب فيها NF4.
لو inference الـ Llama 3 70B بياخد 8 ثواني والمستخدم بيقفل التاب، Speculative Decoding بيقطع الزمن للنص بنفس الموديل ونفس الجودة. الفكرة: موديل صغير سريع بيخمّن، موديل كبير بيتأكد بالتوازي. مقال للمحترف بمثال الكاشير للمبتدئ، التعريف العلمي الدقيق للـ acceptance probability من ورقة DeepMind 2023، كود vLLM 0.6+ شغّال، أرقام مقاسة على H100 (24 → 71 توكن/ثانية)، trade-offs الذاكرة والـ batching، وحالات لا تستخدم فيها التقنية أصلاً.
لو حسبت فاتورة Claude الشهرية بالعربي ولقيتها 3 أضعاف نفس الـ workload بالإنجليزي، السبب مش زيادة في السعر. السبب مفهوم اسمه Tokenization. مقال للمبتدئ بمثال قطع الليجو، تعريف علمي للـ Byte-Pair Encoding، كود Python شغّال على Anthropic SDK يقيس الفرق، أرقام مقاسة من 500 سؤال إنتاج، 4 خطوات توفير عملية، trade-offs، وحالات لا يستحق الموضوع فيها وقتك أصلاً.
لو تطبيقك بيتقل 80ms كل أسبوع وانت ما تشعرش، السبب مش مهندس عمل غلطة كبيرة، السبب 30 PR كل واحد ضايف ضريبة صغيرة. شرح للمحترف بمثال المطعم للمبتدئ، إعداد Lighthouse CI كامل على GitHub Actions، assertions على LCP و INP و CLS و bundle size، أرقام مقاسة من فريق 12 مطور، trade-offs زمن الـ build و false positives، ومتى لا تستخدمها.
لو الـ RAG بتاعك بيفشل في الأسئلة اللي فيها رقم منتج أو UUID أو اسم خطأ تقني، Dense search لوحده مش كفاية. Hybrid Search بيدمج BM25 مع Embeddings عبر Reciprocal Rank Fusion ويرفع الاسترجاع من 78% لـ 96% على BEIR. مقال للمحترف بمثال أمين المكتبة للمبتدئ، تعريف علمي للـ RRF، كود Python شغّال على rank_bm25 + sentence-transformers، أرقام مقاسة، trade-offs، وحالات لا تستخدمه فيها.
لو خدمة من microservices بطئت أو فشلت، الطلبات بتتكدّس وبتسحب باقي الخدمات. Circuit Breaker بيقطع الطلبات تلقائيًا، يدّي الخدمة فرصة تتعافى، وبعدين يجرّب يرجّعها. شرح للمستوى المتوسط بمثال قاطع الكهربا، تعريف علمي للحالات الثلاث، كود Node.js شغّال بـ opossum، أرقام مقاسة من الإنتاج، trade-offs واضحة، وحالات لا تستخدمه فيها.
لو موقعك بيستدعي API خارجي زي Stripe أو Google Fonts، أول طلب بيدفع ضريبة 240ms في DNS وTLS handshake. preconnect وdns-prefetch بسطرين HTML بيخلّوا المتصفح يدفع الضريبة دي مبكرًا فأول طلب فعلي يطلع تقريبًا فوريًا. مقال للمستوى المبتدئ بمثال جرس الشقة، تعريف علمي دقيق، كود HTML شغّال، أرقام مقاسة على Fast 3G، trade-offs، وحالات لا تستخدمها فيها.
لو cache فيه 100 مليون مفتاح وكل request بيدوّر هل المفتاح موجود قبل ما يروح للـ DB، Bloom filter بيخلّيك تجاوب على السؤال ده في 90 نانو ثانية بـ 114MB رام بدل 4GB. مقال للمستوى المتوسط/المحترف بمثال قائمة الفرح، تعريف علمي دقيق، كود Python و Redis شغّال، أرقام مقاسة، trade-offs، وحالات لا تستخدم فيها.
مدونة أحمد حايس تجيب عن أسئلة مثل كيف أتعلم البرمجة أو التكنولوجيا أو الذكاء الاصطناعي، وتحوّل المفاهيم التقنية إلى مقالات عربية عملية واضحة.