أحمد حايس
الرئيسيةمن أناالدوراتالمدونةالمناهج والباقات
أحمد حايس

دورات عربية متخصصة في التقنية والبرمجة والذكاء الاصطناعي.

المنصة مبنية على الوضوح، التطبيق، والنتيجة النافعة: شرح مرتب يساعدك تفهم الأدوات، تكتب كودًا أفضل، وتستخدم الذكاء الاصطناعي بوعي داخل العمل الحقيقي.

تعلم أسرعوصول مباشر للدورات والمسارات من الموبايل.
تنقل أوضحالروابط الأساسية والدعم في مكان واحد بدون تشتيت.

المنصة

  • الرئيسية
  • من أنا
  • الدورات
  • المناهج والباقات
  • المدونة

الدعم

  • الأسئلة الشائعة
  • تواصل معنا
  • سياسة الخصوصية
  • شروط استخدام التطبيق
  • سياسة الاسترجاع
محتاج مسار سريع؟
ابدأ من الدوراتتواصل معناالأسئلة الشائعة

© 2026 أحمد حايس. جميع الحقوق محفوظة.

الرئيسيةالدوراتالمناهجالمدونةالدخول

المدونة

مقالات عملية مرتبة حسب المجال والمستوى، اختر المجال المناسب واقرأ من مستوى مبتدئ إلى محترف.

المجال
كل المجالات
تكنولوجياDevOps بالعربيHow To Make ItOptimizing بالعربيأحدث أخبار التكنولوجياالأوتوميشنالبرمجة بالعربيالذكاء الاصطناعي
المستوى
كل المستوياتمبتدئمتوسطمحترف
AWQ Quantization للمحترف: Llama 70B على H100 واحدة بـ 35GB
محترف١٧ مايو ٢٠٢٦

AWQ Quantization للمحترف: Llama 70B على H100 واحدة بـ 35GB

سيرفر Llama 3.3 70B على 4×A100 بيكلّفك $11,820 شهرياً. AWQ INT4 quantization بينزّل الذاكرة من 140GB لـ 35GB، يخلّيك تشغّله على H100 واحدة بتكلفة 75% أقل. مقال للمحترف بمثال ضغط JPEG للمبتدئ، شرح علمي من ورقة Lin 2023 (MIT Han Lab)، configuration vLLM 0.6.4 شغّال، مقارنة AWQ vs GPTQ بأرقام Marlin kernel (10.9× speedup)، أرقام مقاسة على H100 (741 token/ثانية، MMLU-Pro retention 98.1%)، 4 trade-offs خفية بتظهر في الإنتاج، ومتى Quantization كارثة على الموديل.

6 دقائق قراءة
Long Context vs RAG للمحترف: متى تشيل Qdrant وتعتمد على 1M Token
محترف١٦ مايو ٢٠٢٦

Long Context vs RAG للمحترف: متى تشيل Qdrant وتعتمد على 1M Token

لو فاتورة Qdrant + reranker + embeddings بقت $1,124 شهرياً على corpus 7.7M token، الـ 1M token context في Claude Sonnet 4.6 ممكن يوفّر 56% من التكلفة ويرفع الدقة 12 نقطة. مقال للمحترف بمثال المكتبة الشخصية للمبتدئ، تعريف علمي من ورقة Lewis 2020 (RAG)، أرقام مقاسة على workload Fintech عربي بـ 3,200 سؤال شهرياً، كود Python يقارن النسختين على anthropic SDK 0.49 مع prompt caching، 4 trade-offs خفية في latency و cost predictability و debugging و vendor lock-in، ومتى Long Context كارثة compliance.

7 دقائق قراءة
Speculative Decoding للمحترف: تسريع vLLM 2.4× بنموذج draft صغير
محترف١٥ مايو ٢٠٢٦

Speculative Decoding للمحترف: تسريع vLLM 2.4× بنموذج draft صغير

لو throughput الـ Llama 3.1 70B واقف عند 38 token/ثانية على H100، المشكلة مش في الـ GPU. Speculative Decoding بيحل decoding bottleneck بنموذج draft 1B بيقترح والنموذج الكبير بيتحقق بالتوازي. مقال للمحترف بمثال المحرر والمساعد للمبتدئ، شرح علمي من ورقة Leviathan 2023، configuration vLLM شغّال، أرقام مقاسة (38 → 91 token/ثانية، acceptance rate 73.4%)، 4 trade-offs خفية، ومتى الـ technique دي بتكون قرار غلط.

7 دقائق قراءة
Speculative Decoding للمحترف: ضاعف سرعة Llama 70B لـ 2.4x بدون فقد token واحد
محترف١١ مايو ٢٠٢٦

Speculative Decoding للمحترف: ضاعف سرعة Llama 70B لـ 2.4x بدون فقد token واحد

لو شات بوتك على Llama 3.1-70B بيطلع 28 token/sec وفاتورة GPU وصلت $1,400 شهرياً، انت بتدفع تمن compute مش بتستخدمه. Speculative Decoding من ورقة Leviathan 2023 بيرفع الرقم لـ 67 token/sec على نفس الـ GPU بدون retraining ولا فقد جودة token واحد. شرح للمحترف بمثال الكاتب والمراجع للمبتدئ، تعريف رياضي من DeepMind، كود Python على vLLM 0.6+ شغّال، أرقام مقاسة على H100 80GB، 4 trade-offs خفية، ومتى التقنية بتكون مضيعة وقت.

7 دقائق قراءة
MCP للمحترف: ابني سيرفر Model Context Protocol إنتاجي في 60 سطر Python
محترف١١ مايو ٢٠٢٦

MCP للمحترف: ابني سيرفر Model Context Protocol إنتاجي في 60 سطر Python

دليل تنفيذي للمحترف لبناء سيرفر MCP حقيقي بـ FastMCP يقرأ من PostgreSQL ويُركَّب على Claude Desktop في أقل من 10 دقايق، مع شرح JSON-RPC 2.0 و primitives الـ MCP، أرقام مقاسة على فريق 14 مطور (انخفاض glue code 85%، p95 latency 38ms على stdio)، 4 trade-offs خفية، ومتى MCP overhead أكبر من قيمته.

6 دقائق قراءة
Reranking للمحترف: لما Cosine Similarity بتكذب على Production RAG
محترف١١ مايو ٢٠٢٦

Reranking للمحترف: لما Cosine Similarity بتكذب على Production RAG

دليل تنفيذي للمحترف يثبت إن Vector Search لوحده Recall@5 = 67% على corpus قانوني عربي بـ 22,300 وثيقة، وإضافة Cohere Rerank 3.5 بترفعه لـ 91.2% مع تكلفة latency +312ms. كود Python في 18 سطر، مقارنة Cohere Rerank 3.5 vs BGE-reranker-v2-m3، 4 trade-offs خفية، و3 حالات Reranking فيها مضيعة وقت.

5 دقائق قراءة
GraphRAG للمحترف: لما Vector Search بيفشل في أسئلة العلاقات والتسلسل
محترف١١ مايو ٢٠٢٦

GraphRAG للمحترف: لما Vector Search بيفشل في أسئلة العلاقات والتسلسل

Vector RAG التقليدي بيرجّع chunks قريبة دلاليًا، لكنه بيفشل على أسئلة العلاقات والتسلسل الزمني. GraphRAG من Microsoft Research بيرفع Precision@10 من 58% لـ 89% على corpus قانوني عربي بـ 18,400 وثيقة، بكود Python شغّال على Claude Sonnet 4.6 و Haiku 4.5، مع 4 trade-offs خفية، ومتى GraphRAG بيكون مبالغة هندسية.

7 دقائق قراءة
Prompt Injection للمحترف: 4 طبقات حماية لتطبيق Claude
محترف١٠ مايو ٢٠٢٦

Prompt Injection للمحترف: 4 طبقات حماية لتطبيق Claude

31% من تطبيقات LLM في الإنتاج بتسرّب system prompt بهجوم أقل من 5 سطور. مقال للمحترف بمثال موظف الاستقبال للمبتدئ، تعريف علمي من Greshake et al. 2023 و OWASP LLM01:2025، 4 طبقات حماية بكود Python شغّال على anthropic SDK 0.45+، أرقام مقاسة على 1,200 هجوم على تطبيق عربي (الطبقة الأولى وحدها بتمنع 58%)، 4 trade-offs، ومتى الحماية الكاملة مبالغة هندسية.

6 دقائق قراءة
Hybrid Search للمحترف: BM25 + Vector يرفع Recall من 67% لـ 91%
محترف٨ مايو ٢٠٢٦

Hybrid Search للمحترف: BM25 + Vector يرفع Recall من 67% لـ 91%

لو RAG بتاعك بيرجّع chunks قريبة دلالياً بس ما فيهاش رقم النسخة أو كود الخطأ اللي المستخدم سأل عنه، Vector Search مش غلطان — هو بيقيس المعنى مش الـ exact tokens. دمج BM25 مع Vector عبر Reciprocal Rank Fusion بيرفع Recall@10 من 67% لـ 91% على corpus عربي بـ 24K chunk، بفارق latency أقل من 18ms. مقال للمحترف بمثال المكتبة بفهرسين للمبتدئ، تعريفات علمية من Robertson 2009 و Cormack SIGIR 2009، كود Python شغّال على rank-bm25 و ChromaDB، 4 trade-offs حقيقية، وحالات Hybrid فيها مضيعة وقت.

6 دقائق قراءة

عرض 10 - 18 من 40 مقال

السابق
1
2
3
4
5
التالي