المدونة

مقالات عملية مرتبة حسب المجال والمستوى، اختر المجال المناسب واقرأ من مستوى مبتدئ إلى محترف.

محترف30 يوليو 2026

التكميم (Quantization): شغّل نموذج 70B على كارت شاشة واحد

تكميم النموذج بينزّل ذاكرة الأوزان من 16 بت لـ 4 بت، فيوفّر ~4 أضعاف VRAM مقابل فرق دقة صغير. شرح للمحترف بمثال مبسّط ثم علميًا، مع كود bitsandbytes وllama.cpp شغّال، أرقام مقاسة، trade-offs، ومتى لا تستخدمه، مع مصادر رسمية.

4 دقائق قراءة

محترف28 يوليو 2026

ndots:5: ليه نداء DNS واحد في Kubernetes بيتحوّل لـ 5 استعلامات

لو خدمتك في Kubernetes بتنادي API خارجي وبتحس بتأخير غامض، غالبًا السبب سطر options ndots:5 في resolv.conf بيحوّل كل نداء لخمسة استعلامات DNS. المقال للمحترف يشرح السبب بمثال بسيط ثم علميًا، مع باتش dnsConfig قابل للنسخ، أرقام قبل وبعد، الـ trade-offs، ومتى لا تستخدمه، مع مصادر رسمية.

5 دقائق قراءة

محترف26 يوليو 2026

فلتر بلوم: تعرف إن العنصر "أكيد مش موجود" في خانة واحدة

فلتر بلوم يرد على سؤال "العنصر موجود؟" في خانة ذاكرة واحدة بدون ما يلمس القرص. اعرف كيف يعمل بمثال بسيط ثم علميًا، مع كود Python شغّال، معادلة الخطأ الإيجابي بأرقام حقيقية، الـ trade-offs، ومتى لا تستخدمه، مع مصادر.

5 دقائق قراءة

محترف25 يوليو 2026

فك التشفير التخميني: إزاي تسرّع استدلال الـ LLM 2 إلى 3 أضعاف بدون تغيير الموديل

تقدر تخفّض زمن توليد كل توكن في نموذج اللغة الكبير 2 إلى 3 أضعاف بموديل صغير بيخمّن قدّام والنموذج الكبير بيتحقق دفعة واحدة، بنفس المخرجات بالظبط. شرح للمحترف بمثال واضح ثم علميًا، مع كود vLLM وTransformers شغّال، أرقام مقاسة، الـ trade-offs، ومتى لا تستخدمه، بمصادر رسمية.

5 دقائق قراءة

محترف23 يوليو 2026

الـ KV Cache وPagedAttention: ليه سيرفر الـ LLM بيخنق عند 10 مستخدمين

سيرفر نموذج اللغة بتاعك بيوقف عند 10 مستخدمين رغم إن كرت الشاشة نصه فاضي؟ المشكلة مش في القوة، المشكلة إن الـ KV Cache بيهدر 60–80% من الذاكرة على تجزئة وحجز مبكر. المقال للمحترف يشرح السبب بمثال بسيط ثم علميًا، مع إعداد vLLM قابل للنسخ، أرقام مقاسة (إنتاجية 2–24 ضعفًا)، الـ trade-offs، ومتى لا تستخدمه، بمصادر رسمية.

5 دقائق قراءة

محترف23 يوليو 2026

النسخة الاحتياطية اللي معملتش لها استعادة مش نسخة احتياطية: أتمتة التحقق كل ليلة

لو بتاخد نسخ احتياطية كل ليلة وعمرك ما جربت تستعيد واحدة، انت مش مأمّن — انت بتقامر. المقال للمحترف يبني بايبلاين يستعيد أحدث نسخة تلقائيًا كل ليلة، يشغّل استعلام تحقق، ويقيس زمن الاستعادة (RTO) الحقيقي، بسكربت Bash + pg_restore شغّال، أرقام مقاسة، trade-offs، ومتى لا تحتاجه، مع مصادر رسمية.

5 دقائق قراءة

محترف21 يوليو 2026

الـ Integer Overflow: ليه (low + high) / 2 باج في كل بحث ثنائي تقريبًا

سطر رياضي بسيط في قلب البحث الثنائي ظل باجًا خفيًا في المكتبات القياسية عشرين سنة. المقال للمحترف يشرح تجاوز السعة العددية بنظام المتممة الثنائية، بمثال العدّاد، ثم علميًا، مع كود Java يفجّر الخطأ بأرقام دقيقة، الإصلاح، سيناريو واقعي (Ariane 5 وJDK)، وtrade-offs، ومتى لا تشغل بالك، مع مصادر رسمية.

5 دقائق قراءة

محترف20 يوليو 2026

False Sharing: ليه توزيع الشغل على 8 أنوية يخلّي كودك أبطأ

تقدر تكسب سرعة 7 أضعاف في كود متعدد الخيوط بدون ما تغيّر سطر واحد في المنطق. المقال يشرح الـ false sharing على مستوى الـ cache line، بكود Go يقيس الفرق، الحل بالـ padding، والمقايضات، ومتى لا تشغل بالك، بمصادر رسمية.

5 دقائق قراءة

محترف19 يوليو 2026

CPU Throttling في Kubernetes: ليه بودك بطيء والمعالج مستريح؟

لو الـ p99 بتاع خدمتك بيقفز لثانيتين ومتوسط استهلاك المعالج تحت 40%، غالبًا مش محتاج عقدة أقوى — الـ kernel بيكبح بودك بسبب CFS quota. مقال للمحترف يشرح المفهوم بمثال بسيط ثم علميًا، مع أوامر cpu.stat وPromQL للكشف، سيناريو بأرقام (كبح 63% ← 6%، p99 من 2100ms لـ 240ms)، ثلاث روافع حل بمقايضاتها، تحذير على مستوى الـ kernel، ومتى لا تشيل الحدود، مع مصادر رسمية.

5 دقائق قراءة

محترف18 يوليو 2026

انفجار الكارديناليتي في Prometheus: ليه بياكل رامك وبيموت بـ OOMKilled، وإزاي توقفه

لو Prometheus بيتقتل بـ OOMKilled والرام بتقفز فجأة من غير زيادة ترافيك، غالبًا السبب ليبل واحد غير محدود (زي user_id) بيفجّر عدد السلاسل الزمنية. اعرف تكتشف المشكلة بـ PromQL و/status/tsdb، وتصلّحها بالـ relabeling، بأرقام حقيقية وحدود قابلة للتطبيق ومصادر رسمية.

5 دقائق قراءة