الذكاء الاصطناعي

مقالات عملية مرتبة حسب المجال والمستوى، اختر المجال المناسب واقرأ من مستوى مبتدئ إلى محترف.

محترف30 يونيو 2026

فك التشفير التخميني: ضاعف سرعة استدلال LLM بلا خسارة في الجودة

فك التشفير التخميني بيخلّي نموذج مسوّدة صغير يقترح والنموذج الكبير يتحقق بالتوازي، فتكسب سرعة 2×–3× بنفس المخرجات بالظبط. شرح المبدأ، إعداد vLLM قابل للنسخ، معدّل القبول، والمقايضات، ومتى متستخدموش.

5 دقائق قراءة

محترف28 يونيو 2026

PagedAttention في vLLM: ليه خدمة الـ LLM بتهدر 80% من ذاكرة الـ GPU وإزاي توصل throughput أعلى 24×

معظم سيرفرات الـ LLM بتهدر 60–80% من ذاكرة الـ GPU بسبب طريقة حجز الـ KV cache. PagedAttention في vLLM بتنزّل التهدير لأقل من 4% وترفع الإنتاجية حتى 24× على نفس العتاد. شرح للمحترف بكود vLLM وأرقام مقاسة وtrade-offs ومتى متستخدمهوش، مع مصادر.

6 دقائق قراءة

مبتدئ25 يونيو 2026

نماذج الانتشار للمبتدئ: ازاي الذكاء الاصطناعي بيرسم صورة من جملة نص

تكتب جملة، فيطلع لك صورة لم تكن موجودة. مقال للمبتدئ يشرح نماذج الانتشار (Diffusion Models) بمثال المثّال والرخام، ثم شرح علمي للضجيج وعكسه، كود diffusers شغّال، أرقام حقيقية للخطوات وزمن التوليد، ومعامل التوجيه، مع مصادر رسمية.

5 دقائق قراءة

محترف24 يونيو 2026

Mixture of Experts للمحترف: سعة 671 مليار باراميتر بحساب 37 مليار فقط

MoE بيخلّيك تبني نموذج بسعة 671 مليار باراميتر وتدفع تكلفة حساب 37 مليار فقط لكل توكن. شرح للمحترف بمثال العيادة، كود PyTorch لطبقة top-2 gating، أرقام DeepSeek-V3 وMixtral، وموازنة المكاسب مقابل تكلفة الذاكرة، ومتى لا تستخدم MoE، مع مصادر.

5 دقائق قراءة

متوسط22 يونيو 2026

الكاش الدلالي للمتوسط: امنع 60% من نداءات LLM API لأسئلة مكررة بمعنى مختلف

لو شات بوتك بيستقبل نفس السؤال بصيغ مختلفة آلاف المرات, انت بتدفع نداء LLM كامل في كل مرة. الكاش الدلالي بيرجّع الإجابة المخزّنة للأسئلة المتشابهة في المعنى مش الحروف, فينزّل التكلفة وزمن الاستجابة. مقال للمتوسط بمثال موظف خدمة العملاء, شرح علمي للتشابه الكوني وكود Python شغّال, أرقام مقاسة, فخ الـ false hit, trade-offs, ومتى متستخدموش, مع مصادر.

5 دقائق قراءة

متوسط20 يونيو 2026

وكلاء الذكاء الاصطناعي: إزاي حلقة ReAct بتمنع الـ LLM من الهلوسة

الـ LLM لوحده بيخمّن لما تسأله عن بيانات حيّة. وكيل الذكاء الاصطناعي بيحوّله من مُخمِّن لمنفّذ بيفكر، ينده أداة، يقرا النتيجة، ويكرّر لحد ما يخلّص. شرح للمتوسط لحلقة ReAct بمثال موظف الشحن، كود Python شغّال على Claude tool use، أرقام مقاسة (الدقة من 41% لـ 96%)، trade-offs، ومتى الوكيل overhead.

6 دقائق قراءة

مبتدئ19 يونيو 2026

Context Window للمبتدئ: ليه الذكاء الاصطناعي بينسى أول كلامك في المحادثة الطويلة

لو بعد محادثة طويلة مع ChatGPT أو Claude لقيت النموذج نسي اسمك اللي قلته في الأول، ده مش عطل. ده حد اسمه Context Window. مقال للمبتدئ بمثال السبورة، شرح علمي لنافذة السياق وظاهرة "الضياع في المنتصف"، كود Python شغّال يعدّ التوكنز بـ tiktoken، أرقام حقيقية لأحجام النوافذ (128K مقابل 200K مقابل مليون)، 3 طرق عملية للتعامل، trade-offs، ومتى متشغلش بالك، مع مصادر رسمية.

6 دقائق قراءة

متوسط18 يونيو 2026

Function Calling للمتوسط: ليه شات بوتك بيخترع رقم الطلب بدل ما يجيبه من الـ API

لو شات بوتك بيرد على العميل برقم طلب أو سعر مخترع، المشكلة مش في النموذج — هو ببساطة بيخمّن لأنه معندوش طريقة يجيب البيانات الحقيقية. Function Calling (Tool Use) بيخلّي الـ LLM يطلب تنفيذ دالة عندك بدل ما يهلوس. مقال للمتوسط بمثال الموظف الجديد، تعريف علمي، كود Python شغّال على Claude API، أرقام التزام الـ schema (99.8% مقابل فشل 8–15% بدون enforcement)، 4 trade-offs، ومتى متستخدمهوش، مع مصادر من Anthropic و OpenAI.

5 دقائق قراءة

مبتدئ16 يونيو 2026

Temperature و Top-p للمبتدئ: ليه نفس السؤال بيرد عليه الـ AI كل مرة بإجابة مختلفة

لو سألت ChatGPT أو Claude نفس السؤال وطلعت إجابات مختلفة، السبب إعداد اسمه Temperature. شرح للمبتدئ بمثال زرّ صوت الراديو، تعريف علمي لـ softmax و Nucleus Sampling من ورقة Holtzman 2020، كود Python شغّال يقيس الفرق (87% ← 31%)، Top-p بمثال، سيناريو شات بوت بأرقام، trade-offs، ومتى متلعبش في الإعدادات.

4 دقائق قراءة