أحمد حايس
الرئيسيةمن أناالدوراتالمدونةالمناهج والباقات
أحمد حايس

دورات عربية متخصصة في التقنية والبرمجة والذكاء الاصطناعي.

المنصة مبنية على الوضوح، التطبيق، والنتيجة النافعة: شرح مرتب يساعدك تفهم الأدوات، تكتب كودًا أفضل، وتستخدم الذكاء الاصطناعي بوعي داخل العمل الحقيقي.

تعلم أسرعوصول مباشر للدورات والمسارات من الموبايل.
تنقل أوضحالروابط الأساسية والدعم في مكان واحد بدون تشتيت.

المنصة

  • الرئيسية
  • من أنا
  • الدورات
  • المناهج والباقات
  • المدونة

الدعم

  • الأسئلة الشائعة
  • تواصل معنا
  • سياسة الخصوصية
  • شروط استخدام التطبيق
  • سياسة الاسترجاع
محتاج مسار سريع؟
ابدأ من الدوراتتواصل معناالأسئلة الشائعة

© 2026 أحمد حايس. جميع الحقوق محفوظة.

الرئيسيةالدوراتالمناهجالمدونةالدخول

المدونة

مقالات عملية مرتبة حسب المجال والمستوى، اختر المجال المناسب واقرأ من مستوى مبتدئ إلى محترف.

المجال
كل المجالات
تكنولوجياDevOps بالعربيHow To Make ItOptimizing بالعربيأحدث أخبار التكنولوجياالأوتوميشنالبرمجة بالعربيالذكاء الاصطناعي
المستوى
كل المستوياتمبتدئمتوسطمحترف
Prompt Caching في Claude للمتوسط: وفّر 90% من تكلفة الـ system prompt الطويل
متوسط٨ مايو ٢٠٢٦

Prompt Caching في Claude للمتوسط: وفّر 90% من تكلفة الـ system prompt الطويل

لو بتبعت لـ Claude نفس system prompt بـ 8000 توكن مع كل request، إنت بتدفع تكلفة التوكنز دي 1000 مرة في اليوم بدون داعي. Prompt Caching بيخلّيك تدفع 25% من السعر بس على أول request، و10% بس على الـ requests اللي بعدها لمدة 5 دقايق. شرح للمستوى المتوسط بمثال أمين المكتبة للمبتدئ، تعريف علمي دقيق من توثيق Anthropic، كود Python شغّال على anthropic SDK 0.40+، أرقام مقاسة على 1000 سؤال (89.9% توفير)، 4 trade-offs حقيقية، وحالات لا تستخدم Caching فيها.

7 دقائق قراءة
Prompt Caching في Claude للمتوسط: وفّر 89% من فاتورة Anthropic بسطر cache_control
متوسط٨ مايو ٢٠٢٦

Prompt Caching في Claude للمتوسط: وفّر 89% من فاتورة Anthropic بسطر cache_control

لو فاتورة Anthropic عندك بتعدّي $800 شهريًا وأكتر من 70% بتروح في إعادة إرسال نفس system prompt الطويل، Prompt Caching بسطر cache_control بينزّل الفاتورة لـ $80 على نفس الـ workload. مقال للمتوسط بمثال دروس المنهج للمبتدئ، تعريف علمي للـ KV cache و TTL، كود Python شغّال على Anthropic SDK 0.40+، أرقام مقاسة من workload 8000 request يومي، 4 trade-offs، ومتى لا تستخدمه.

4 دقائق قراءة
Prompt Caching في Claude للمتوسط: نزّل فاتورة الـ system prompt 90% بسطر JSON واحد
متوسط٨ مايو ٢٠٢٦

Prompt Caching في Claude للمتوسط: نزّل فاتورة الـ system prompt 90% بسطر JSON واحد

لو تطبيقك بيبعت نفس الـ system prompt الطويل آلاف المرات يومياً لـ Claude، أنت بتدفع نفس التوكنز كل مرة من غير داعي. Prompt Caching بيخلّي Anthropic تخزّن البريفكس على سيرفرها وترجعه بـ 10% من السعر و80% أقل في زمن أول توكن. شرح للمتوسط بمثال مكتب البريد للمبتدئ، تعريف علمي لـ KV cache والـ ephemeral storage، كود Python شغّال على Anthropic SDK 0.40+، أرقام مقاسة من فاتورة 2000 request/يوم، الفرق بين 5-min و 1-hour cache، trade-offs الـ writes الزيادة والـ ordering، وحالات لا تستخدم فيها الـ caching أصلاً.

7 دقائق قراءة
Prompt Caching في Claude للمتوسط: ادفع 90% أقل لما المستند بيتكرّر في كل طلب
متوسط٨ مايو ٢٠٢٦

Prompt Caching في Claude للمتوسط: ادفع 90% أقل لما المستند بيتكرّر في كل طلب

لو بتبعت نفس المستند الطويل لـ Claude في كل طلب، Prompt Caching بينزّل تكلفة الـ input للجزء المُكاش لـ 10% فقط ويسرّع الرد بنسبة 80% على المتوسط. مقال للمستوى المتوسط بمثال مكتب الاستقبال للمبتدئ، تعريف علمي للـ cache_control و TTL، كود Python شغّال على Anthropic SDK، أرقام مقاسة من workload 200 طلب يومي، trade-offs الذاكرة والتكلفة الأولى، وحالات لازم تطفي الـ cache فيها أصلاً.

5 دقائق قراءة
Quantization للمستوى المتوسط: شغّل Llama 3 70B على GPU 24GB بدل 140GB
متوسط٨ مايو ٢٠٢٦

Quantization للمستوى المتوسط: شغّل Llama 3 70B على GPU 24GB بدل 140GB

لو حاولت تشغّل Llama 3 70B محلياً والـ GPU بتاعك 24GB، الموديل بيقولك "محتاج 140GB". Quantization بيقطع الذاكرة لـ 25% بفقدان أقل من نقطة على MMLU. مقال للمستوى المتوسط بمثال السوبرماركت للمبتدئ، تعريف علمي للـ AWQ و GPTQ، كود vLLM شغّال على RTX 4090، أرقام مقاسة من MMLU و HumanEval، trade-offs، وحالات لا تستخدم فيها الـ Quantization أصلاً.

7 دقائق قراءة
Quantization للمتوسط: شغّل LLM بـ 70 مليار باراميتر على GPU واحد بـ 35GB
متوسط٨ مايو ٢٠٢٦

Quantization للمتوسط: شغّل LLM بـ 70 مليار باراميتر على GPU واحد بـ 35GB

لو موديل Llama 3.1 70B بيطلب 140GB ذاكرة وعندك GPU واحد بـ 48GB، Quantization بيقطع المتطلبات للربع — 35GB — مع خسارة دقة أقل من 1% على MMLU. مقال للمستوى المتوسط بمثال ضغط الصور للمبتدئ، تعريف علمي للـ AWQ و GPTQ، كود Python شغّال على transformers + AutoAWQ، أرقام مقاسة من ورقة AWQ 2024 و Hugging Face، trade-offs، وحالات لا تستخدم Quantization فيها أصلاً.

6 دقائق قراءة
Quantization 4-bit للمتوسط: Llama 70B على A100 واحد بدل 4 GPUs
متوسط٨ مايو ٢٠٢٦

Quantization 4-bit للمتوسط: Llama 70B على A100 واحد بدل 4 GPUs

لو حاولت تشغّل Llama 3.1 70B لقيت إنه محتاج 140GB ذاكرة و4 كروت A100. NF4 Quantization بينزّله لـ40GB وA100 واحد بفقد 0.5% فقط في MMLU. مقال للمتوسط بمثال ضغط الصورة من 16 مليون لون لـ256، شرح علمي للـNormalFloat 4 من ورقة Tim Dettmers (NeurIPS 2023)، كود Python شغّال على bitsandbytes + transformers، أرقام مقاسة (perplexity, MMLU, tok/s)، 4 trade-offs حقيقية، وحالات لازم تتجنّب فيها NF4.

6 دقائق قراءة
Mixture of Experts للمتوسط: ليه DeepSeek 671B سريع زي 37B
متوسط٧ مايو ٢٠٢٦

Mixture of Experts للمتوسط: ليه DeepSeek 671B سريع زي 37B

لو موديل بـ 671 مليار باراميتر بيرد عليك بنفس سرعة موديل 37 مليار، السبب مش تحسين عشوائي. السبب معمارية اسمها Mixture of Experts بتفعّل 5% بس من الموديل لكل توكن. مقال للمستوى المتوسط بمثال المستشفى للمبتدئ، تعريف علمي للراوتر و Top-K Gating، كود PyTorch شغّال يبني MoE Layer من الصفر، أرقام مقاسة من DeepSeek V3 و Mixtral 8x7B، trade-offs الذاكرة، وحالات لا تنفع فيها MoE.

6 دقائق قراءة
Batch API في Claude للمتوسط: ادفع 50% أقل لمعالجة آلاف الأسئلة غير العاجلة
متوسط٥ مايو ٢٠٢٦

Batch API في Claude للمتوسط: ادفع 50% أقل لمعالجة آلاف الأسئلة غير العاجلة

لو بتعالج 10,000 طلب يومي على Claude بتكلفة $300، Batch API بيقطع الفاتورة للنص — $150 — على نفس الموديل وبنفس الجودة. الثمن: تنتظر لحد 24 ساعة بدل ثواني. مقال للمستوى المتوسط بمثال مكتب البريد للمبتدئ، تعريف علمي دقيق، كود Python شغّال على Anthropic SDK 0.40+، أرقام مقاسة على workload 24,000 تذكرة دعم، trade-offs، ومتى لا تستخدمه.

5 دقائق قراءة

عرض 55 - 63 من 89 مقال

السابق
1
…6
7
8
…10
التالي