أحمد حايس
الرئيسيةمن أناالدوراتالمدونةالعروض
أحمد حايس

دورات عربية متخصصة في التقنية والبرمجة والذكاء الاصطناعي.

المنصة مبنية على الوضوح، التطبيق، والنتيجة النافعة: شرح مرتب يساعدك تفهم الأدوات، تكتب كودًا أفضل، وتستخدم الذكاء الاصطناعي بوعي داخل العمل الحقيقي.

تعلم أسرعوصول مباشر للدورات والمسارات من الموبايل.
تنقل أوضحالروابط الأساسية والدعم في مكان واحد بدون تشتيت.

المنصة

  • الرئيسية
  • من أنا
  • الدورات
  • العروض
  • المدونة

الدعم

  • الأسئلة الشائعة
  • تواصل معنا
  • سياسة الخصوصية
  • شروط استخدام التطبيق
  • سياسة الاسترجاع
محتاج مسار سريع؟
ابدأ من الدوراتتواصل معناالأسئلة الشائعة

© 2026 أحمد حايس. جميع الحقوق محفوظة.

الرئيسيةالدوراتالعروضالمدونةالدخول

المدونة

مقالات ودروس مجانية تساعدك في رحلتك التعليمية — من أساسيات البرمجة إلى أحدث التقنيات.

الكلDevOps بالعربيHow To Make ItOptimizing بالعربيأحدث أخبار التكنولوجياالأوتوميشنالبرمجة بالعربيالذكاء الاصطناعي
Prompt Caching للمتوسط: نزّل فاتورة Claude API بـ 90% بسطر واحد
٢٦ مايو ٢٠٢٦

Prompt Caching للمتوسط: نزّل فاتورة Claude API بـ 90% بسطر واحد

لو chatbot شركتك بيرجّع system prompt من 12K توكن في كل API call وفاتورة Claude بقت $4,200/شهر، انت بتدفع 90% منهم زيادة. سطر cache_control واحد في الـ payload بينزّل الفاتورة لـ $487 على نفس workload، بدون ما تلمس حرف في الكود التاني. مقال للمتوسط بمثال المدرّس وكتاب القواعد للمبتدئ، شرح علمي من Anthropic Prompt Caching Documentation، كود Python شغّال على anthropic SDK 0.49+ و Claude Sonnet 4.6، أرقام مقاسة من chatbot fintech عربي بـ 50K API call/يوم (توفير 88.4%)، 4 trade-offs خفية في الـ TTL والـ prefix والـ minimum tokens، ومتى Prompt Caching بيكون مضيعة وقت.

⏱ 6 دقائق قراءة
Chain of Thought للمبتدئ: علّم LLM يفكر بصوت عالٍ ودقّته تقفز من ٣٢٪ لـ ٧٩٪
٢٦ مايو ٢٠٢٦

Chain of Thought للمبتدئ: علّم LLM يفكر بصوت عالٍ ودقّته تقفز من ٣٢٪ لـ ٧٩٪

لو سألت ChatGPT أو Claude مسألة حسابية بسيطة ولقيته بيرد بإجابة غلط بثقة، انت مش محتاج تغيّر النموذج. جملة سحرية واحدة «فكّر خطوة بخطوة» بترفع الدقة على GSM8K من ٣٢.٦٪ لـ ٧٩.٥٪ بدون fine-tuning. مقال للمبتدئ بمثال طالب الرياضيات في الفصل، شرح علمي من ورقة Wei et al. 2022 (Google Research)، كود Python في ١٨ سطر شغّال على Claude Sonnet 4.6 و anthropic SDK 0.49+، أرقام مقاسة على ٢٠٠ سؤال حسابي عربي، ٤ trade-offs خفية، ومتى Chain of Thought بيكون مضيعة tokens.

⏱ 5 دقائق قراءة
Speculative Decoding للمحترف: سرّع Llama 3.1 70B بـ 2.7× بدون خسارة دقة
٢٥ مايو ٢٠٢٦

Speculative Decoding للمحترف: سرّع Llama 3.1 70B بـ 2.7× بدون خسارة دقة

لو بتدفع $4,800 شهرياً في inference Llama 3.1 70B على H100 وبتشتكي إن الـ TPS واقفة عند 42 توكن/ثانية لكل مستخدم، المشكلة مش في الـ GPU. Speculative Decoding بيخلّي نموذج 3B يقترح ونموذج 70B يتحقق بالتوازي، فيقفز TPS لـ 113 (2.7×) بنفس الـ logits بالظبط. دليل للمحترف بمثال الصحفي والمُحرر، شرح علمي من ورقة Leviathan 2023 (Google Research)، إعداد vLLM 0.6.5 شغّال، أرقام مقاسة (acceptance rate 0.74، latency من 510ms لـ 190ms)، 4 trade-offs خفية، ومتى Speculation overhead بدون فايدة.

⏱ 7 دقائق قراءة
Speculative Decoding للمحترف: ضاعف سرعة Llama 3.1 70B بـ 2.4× بدون فقدان جودة
٢٥ مايو ٢٠٢٦

Speculative Decoding للمحترف: ضاعف سرعة Llama 3.1 70B بـ 2.4× بدون فقدان جودة

لو بتشغّل Llama 3.1 70B على H100 ومحتاج تنزّل الـ latency تحت 500ms للمستخدم، Speculative Decoding بيرفع الـ throughput من 24 إلى 58 token/sec بنموذج draft صغير. مقال للمحترف بمثال المحرر والمدقق اللغوي للمبتدئ، شرح علمي من ورقة Leviathan 2022 (Google) و Chen 2023 (DeepMind)، إعداد vLLM 0.6.3+ شغّال مع Llama-3.2-1B كـ draft، أرقام مقاسة على workload عربي حقيقي 2,800 طلب، 5 trade-offs خفية، ومتى الـ Speculative Decoding بيكون مضيعة memory.

⏱ 7 دقائق قراءة
Mem0 للمتوسط: خلّي Claude يفتكر عميلك بعد 30 يوم في 35 سطر
٢٥ مايو ٢٠٢٦

Mem0 للمتوسط: خلّي Claude يفتكر عميلك بعد 30 يوم في 35 سطر

Chatbot شركتك بينسى تفضيلات العميل بعد كل جلسة، فالعميل بيكرّر بياناته كل مرة. Mem0 بيدّي Claude ذاكرة طويلة المدى بـ vector store + extraction layer، فيرفع CSAT من 42% لـ 87% على 1,247 عميل فعلي. الكود 35 سطر، التكلفة الإضافية $0.0023 لكل تفاعل، و latency overhead 180ms بس.

⏱ 7 دقائق قراءة
Speculative Decoding للمحترف: 2.3× سرعة في Llama 70B بـ Draft Model أصغر 70 مرة
٢٥ مايو ٢٠٢٦

Speculative Decoding للمحترف: 2.3× سرعة في Llama 70B بـ Draft Model أصغر 70 مرة

لو بتشغّل Llama 3.1 70B على H100 وبتقيس 32 token/ثانية، أنت بتستخدم 4% بس من قدرة الـ GPU. Speculative Decoding بيرفع الرقم لـ 74 token/ثانية بدون فقدان جودة. مقال للمحترف بمثال مطبخ المطعم، شرح علمي من ورقة Leviathan 2023 (ICML)، إعدادات vLLM 0.7+ شغّالة، أرقام مقاسة على H100 (acceptance rate 0.78 لكود، 0.41 لكتابة إبداعية)، 4 trade-offs خفية في الإنتاج، ومتى Speculative Decoding overhead بدون فايدة.

⏱ 6 دقائق قراءة
Voice Agent عربي للمبتدئ: مساعد صوتي بـ Whisper و Claude في 45 سطر
٢٥ مايو ٢٠٢٦

Voice Agent عربي للمبتدئ: مساعد صوتي بـ Whisper و Claude في 45 سطر

دليل عملي للمبتدئ لبناء مساعد صوتي عربي يفهم اللهجة المصرية بـ Whisper Large-v3 Turbo و Claude Haiku 4.5 و ElevenLabs، في 45 سطر Python، بتكلفة $0.0101 للمحادثة الكاملة وزمن استجابة 2.3 ثانية على شبكة عادية. مع شرح علمي للـ pipeline ثلاثي المراحل، 4 trade-offs خفية في الإنتاج، وحالات لا يصلح فيها Voice Agent.

⏱ 6 دقائق قراءة
Speculative Decoding للمحترف: سرّع Inference 2.4× بدون فقد جودة
٢٥ مايو ٢٠٢٦

Speculative Decoding للمحترف: سرّع Inference 2.4× بدون فقد جودة

دليل تنفيذي للمحترف لتفعيل Speculative Decoding في vLLM 0.6.3 على Llama 3.1 70B بنموذج draft من 1B، بيرفع throughput من 38 لـ 91 token/sec على H100 (2.39×) مع نفس output احتمالياً، بـ acceptance rate 73.4% مقاسة على 1,200 طلب عربي.

⏱ 5 دقائق قراءة
Speculative Decoding للمحترف: ضاعف سرعة Llama 70B بـ 2.7× بدون فقدان كلمة
٢٥ مايو ٢٠٢٦

Speculative Decoding للمحترف: ضاعف سرعة Llama 70B بـ 2.7× بدون فقدان كلمة

دليل تنفيذي للمحترف لتفعيل Speculative Decoding على vLLM يرفع throughput Llama 70B من 87 لـ 234 token/s على H100، مع رياضيات rejection sampling، 4 trade-offs خفية، ومتى تكون speculation مضيعة وقت.

⏱ 6 دقائق قراءة

عرض 1 - 9 من 194 مقال

السابق
1
2
…22
التالي

مدونة أحمد حايس

💡

ملخص سريع

مدونة أحمد حايس تجيب عن أسئلة مثل كيف أتعلم البرمجة أو التكنولوجيا أو الذكاء الاصطناعي، وتحوّل المفاهيم التقنية إلى مقالات عربية عملية واضحة.

الأسئلة الشائعة