المدونة

مقالات ودروس مجانية تساعدك في رحلتك التعليمية — من أساسيات البرمجة إلى أحدث التقنيات.

الكل DevOps بالعربي How To Make It Optimizing بالعربي أحدث أخبار التكنولوجيا الأوتوميشن البرمجة بالعربي الذكاء الاصطناعي

٨ مايو ٢٠٢٦

Quantization للمتوسط: شغّل LLM بـ 70 مليار باراميتر على GPU واحد بـ 35GB

لو موديل Llama 3.1 70B بيطلب 140GB ذاكرة وعندك GPU واحد بـ 48GB، Quantization بيقطع المتطلبات للربع — 35GB — مع خسارة دقة أقل من 1% على MMLU. مقال للمستوى المتوسط بمثال ضغط الصور للمبتدئ، تعريف علمي للـ AWQ و GPTQ، كود Python شغّال على transformers + AutoAWQ، أرقام مقاسة من ورقة AWQ 2024 و Hugging Face، trade-offs، وحالات لا تستخدم Quantization فيها أصلاً.

⏱ 6 دقائق قراءة

٨ مايو ٢٠٢٦

GIL في Python للمحترف: ليه threading مش بيسرّع كودك حتى مع 16 core

لو شغّلت 8 threads في Python على CPU بـ 16 core وفوجئت إن الكود ماتسرّعش بل بطئ، السبب اسمه Global Interpreter Lock. مقال للمحترف بمثال الميكروفون الواحد للمبتدئ، تعريف علمي دقيق لـ CPython وbytecode evaluation، كود Python 3.12 شغّال يقيس الفرق بين threading و multiprocessing، أرقام مقاسة فعلياً، نظرة على PEP 703 وفكرة free-threaded Python، trade-offs واضحة، وحالات يبقى فيها threading منطقي رغم الـ GIL.

⏱ 6 دقائق قراءة

٨ مايو ٢٠٢٦

Quantization 4-bit للمتوسط: Llama 70B على A100 واحد بدل 4 GPUs

لو حاولت تشغّل Llama 3.1 70B لقيت إنه محتاج 140GB ذاكرة و4 كروت A100. NF4 Quantization بينزّله لـ40GB وA100 واحد بفقد 0.5% فقط في MMLU. مقال للمتوسط بمثال ضغط الصورة من 16 مليون لون لـ256، شرح علمي للـNormalFloat 4 من ورقة Tim Dettmers (NeurIPS 2023)، كود Python شغّال على bitsandbytes + transformers، أرقام مقاسة (perplexity, MMLU, tok/s)، 4 trade-offs حقيقية، وحالات لازم تتجنّب فيها NF4.

⏱ 6 دقائق قراءة

٨ مايو ٢٠٢٦

Speculative Decoding للمحترف: ازاي تخلّي LLM يرد 3x أسرع بدون ما تخسر دقة

لو inference الـ Llama 3 70B بياخد 8 ثواني والمستخدم بيقفل التاب، Speculative Decoding بيقطع الزمن للنص بنفس الموديل ونفس الجودة. الفكرة: موديل صغير سريع بيخمّن، موديل كبير بيتأكد بالتوازي. مقال للمحترف بمثال الكاشير للمبتدئ، التعريف العلمي الدقيق للـ acceptance probability من ورقة DeepMind 2023، كود vLLM 0.6+ شغّال، أرقام مقاسة على H100 (24 → 71 توكن/ثانية)، trade-offs الذاكرة والـ batching، وحالات لا تستخدم فيها التقنية أصلاً.

⏱ 6 دقائق قراءة

٧ مايو ٢٠٢٦

Tokenization للمبتدئ: ليه نفس الكلام بالعربي بيتكلف 3x من الإنجليزي على Claude

لو حسبت فاتورة Claude الشهرية بالعربي ولقيتها 3 أضعاف نفس الـ workload بالإنجليزي، السبب مش زيادة في السعر. السبب مفهوم اسمه Tokenization. مقال للمبتدئ بمثال قطع الليجو، تعريف علمي للـ Byte-Pair Encoding، كود Python شغّال على Anthropic SDK يقيس الفرق، أرقام مقاسة من 500 سؤال إنتاج، 4 خطوات توفير عملية، trade-offs، وحالات لا يستحق الموضوع فيها وقتك أصلاً.

⏱ 6 دقائق قراءة

٧ مايو ٢٠٢٦

أتمتة Performance Budget على CI: ارفض أي PR يخفّض الأداء قبل الـ merge

لو تطبيقك بيتقل 80ms كل أسبوع وانت ما تشعرش، السبب مش مهندس عمل غلطة كبيرة، السبب 30 PR كل واحد ضايف ضريبة صغيرة. شرح للمحترف بمثال المطعم للمبتدئ، إعداد Lighthouse CI كامل على GitHub Actions، assertions على LCP و INP و CLS و bundle size، أرقام مقاسة من فريق 12 مطور، trade-offs زمن الـ build و false positives، ومتى لا تستخدمها.

⏱ 6 دقائق قراءة

٧ مايو ٢٠٢٦

Hybrid Search للمحترف: ادمج BM25 مع Dense Embeddings وارفع دقة الاسترجاع لـ 96%

لو الـ RAG بتاعك بيفشل في الأسئلة اللي فيها رقم منتج أو UUID أو اسم خطأ تقني، Dense search لوحده مش كفاية. Hybrid Search بيدمج BM25 مع Embeddings عبر Reciprocal Rank Fusion ويرفع الاسترجاع من 78% لـ 96% على BEIR. مقال للمحترف بمثال أمين المكتبة للمبتدئ، تعريف علمي للـ RRF، كود Python شغّال على rank_bm25 + sentence-transformers، أرقام مقاسة، trade-offs، وحالات لا تستخدمه فيها.

⏱ 7 دقائق قراءة

٧ مايو ٢٠٢٦

Circuit Breaker بـ Node.js: حماية خدمتك من السقوط المتسلسل

لو خدمة من microservices بطئت أو فشلت، الطلبات بتتكدّس وبتسحب باقي الخدمات. Circuit Breaker بيقطع الطلبات تلقائيًا، يدّي الخدمة فرصة تتعافى، وبعدين يجرّب يرجّعها. شرح للمستوى المتوسط بمثال قاطع الكهربا، تعريف علمي للحالات الثلاث، كود Node.js شغّال بـ opossum، أرقام مقاسة من الإنتاج، trade-offs واضحة، وحالات لا تستخدمه فيها.

⏱ 6 دقائق قراءة

٧ مايو ٢٠٢٦

Resource Hints بالعربي: preconnect يوفّر 240ms قبل أول طلب API

لو موقعك بيستدعي API خارجي زي Stripe أو Google Fonts، أول طلب بيدفع ضريبة 240ms في DNS وTLS handshake. preconnect وdns-prefetch بسطرين HTML بيخلّوا المتصفح يدفع الضريبة دي مبكرًا فأول طلب فعلي يطلع تقريبًا فوريًا. مقال للمستوى المبتدئ بمثال جرس الشقة، تعريف علمي دقيق، كود HTML شغّال، أرقام مقاسة على Fast 3G، trade-offs، وحالات لا تستخدمها فيها.

⏱ 5 دقائق قراءة

٧ مايو ٢٠٢٦

Bloom Filters بالعربي: ابحث في 100 مليون مفتاح بـ 114MB رام بدل 4GB

لو cache فيه 100 مليون مفتاح وكل request بيدوّر هل المفتاح موجود قبل ما يروح للـ DB، Bloom filter بيخلّيك تجاوب على السؤال ده في 90 نانو ثانية بـ 114MB رام بدل 4GB. مقال للمستوى المتوسط/المحترف بمثال قائمة الفرح، تعريف علمي دقيق، كود Python و Redis شغّال، أرقام مقاسة، trade-offs، وحالات لا تستخدم فيها.

⏱ 7 دقائق قراءة

مدونة أحمد حايس

💡

ملخص سريع

مدونة أحمد حايس تجيب عن أسئلة مثل كيف أتعلم البرمجة أو التكنولوجيا أو الذكاء الاصطناعي، وتحوّل المفاهيم التقنية إلى مقالات عربية عملية واضحة.

الأسئلة الشائعة

كيف أتعلم التكنولوجيا أو البرمجة من المقالات؟+