مقالات ودروس مجانية تساعدك في رحلتك التعليمية — من أساسيات البرمجة إلى أحدث التقنيات.
الـ Embeddings لوحدها بترجّع 61% precision في الـ RAG. لمّا تضيف Reranker بـ Cohere أو bge-reranker، الرقم بيقفز لـ 89%. مقال للمتوسط بمثال أمين المكتبة، تعريف علمي للفرق بين bi-encoder و cross-encoder، كود Python شغّال على Anthropic SDK + Cohere Rerank، أرقام مقاسة على 5,000 سؤال عربي، 4 trade-offs، ومتى لا تحتاج Reranking أصلًا.
لو سألت ChatGPT يبعت إيميل لعميل، هيقولك "مش قادر". الـ AI Agent بيفتح Gmail لوحده ويبعت. الفرق مش في الذكاء، الفرق في الصلاحيات. مقال للمبتدئ بمثال المساعد الإداري، تعريف علمي للـ ReAct loop من ورقة Yao 2023، كود Python شغّال على Anthropic SDK في 28 سطر، أرقام مقاسة على 4,200 تذكرة دعم عربية، 4 trade-offs، ومتى Agent مش الحل أصلاً.
لو عندك تطبيق AI في إنتاج بيرد على آلاف المستخدمين يوميًا، التقييم اليدوي بيكلّفك أسبوعين شغل لكل 10K رد. LLM-as-Judge بيخلّي Claude يقيّم ردود AI تانية بتوافق 85% مع الإنسان، بكلفة أقل من 0.5%. مقال للمحترف بمثال لجنة التحكيم، تعريف علمي للـ rubric-based scoring من ورقة Zheng et al. NeurIPS 2023، كود Python شغّال على Anthropic SDK، أرقام مقاسة على 12,000 رد عربي، خمس trade-offs خفية، وحالات يفشل فيها التقييم الآلي تمامًا.
لو رفعت 200 PDF في الـ context window، السؤال الواحد بيكلّفك 14 دولار. RAG بيخلّي نفس السؤال بـ سنت ونصف. مقال للمبتدئ بمثال أمين المكتبة، تعريف علمي للـ vector embeddings و cosine similarity، كود Python شغّال على Anthropic SDK + pgvector في 40 سطر، أرقام مقاسة على 200 ملف PDF عربي (4.7M كلمة)، أربع trade-offs، ومتى RAG مش الحل الصح أصلاً.
لو حابب Claude يرد على أسئلة من documentation شركتك بدون fine-tuning بـ$10K، التقنية اسمها RAG. مقال للمبتدئ بمثال أمين المكتبة، تعريف علمي للـ vector embeddings، كود Python شغّال على Anthropic + ChromaDB في 28 سطر، أرقام مقاسة على 5,000 سؤال عربي، 4 trade-offs حقيقية، ومتى ما تستخدمش RAG أصلاً.
لو دوّرت بكلمة "دكتور" في تطبيقك ولاقيت 40% من النتائج المهمة ضاعت لأنها مكتوبة "طبيب"، إنت محتاج Embeddings. شرح للمبتدئ بمثال خريطة المدن، تعريف علمي للـ semantic vector space و cosine similarity، كود Python شغّال على sentence-transformers، أرقام مقاسة على 5,000 سؤال عربي (دقة 84% وتوفير 71% من فاتورة LLM)، 4 trade-offs، ومتى لا تحتاج Embeddings أصلًا.
لو فاتورة Claude بتاعتك بتعدّي $500 شهريًا و system prompt بيتكرر في كل request، إنت بتدفع ضعف المفروض. Prompt Caching بيخفض تكلفة الـ input tokens المتكررة 90% والـ TTFT 80%. مقال للمتوسط بمثال أمين المكتبة، تعريف علمي للـ KV cache reuse، كود Python شغّال على Anthropic SDK، أرقام مقاسة على 12,000 تذكرة دعم عربية، 4 trade-offs، ومتى لا تستخدمه.
لو بتبعت لـ Claude prompt فيه 50K token system + RAG context كل request، إنت بتدفع 90% منهم بدون داعي. Prompt Caching بيخلّيك تخزّن الجزء الثابت لمدة 5 دقائق وتدفع 10% من سعره فقط في الـ requests التالية. مقال للمتوسط بمثال الفندق للمبتدئ، تعريف علمي للـ ephemeral KV cache، كود Python شغّال على anthropic SDK، أرقام مقاسة من إنتاج فعلي، 4 trade-offs حقيقية، ومتى لا تستخدم Prompt Caching أصلاً.
لو بتطلب من Claude يرجّعلك JSON منظم في الـ prompt، 7-12% من الردود بترجع مكسورة في الإنتاج وبتكسر الـ pipeline بتاعك. الحل مش prompt أحسن، الحل تستخدم tool_use كـ schema enforcer. مقال للمتوسط بمثال السكرتير للمبتدئ، تعريف علمي للـ constrained decoding، كود Python شغّال على anthropic 0.40+، أرقام مقاسة على 8,400 طلب عربي (failure rate من 11.2% لـ 0%)، 4 trade-offs، ومتى استخدام JSON الحر يكفيك.
مدونة أحمد حايس تجيب عن أسئلة مثل كيف أتعلم البرمجة أو التكنولوجيا أو الذكاء الاصطناعي، وتحوّل المفاهيم التقنية إلى مقالات عربية عملية واضحة.