مقالات عملية مرتبة حسب المجال والمستوى، اختر المجال المناسب واقرأ من مستوى مبتدئ إلى محترف.
لو بتبعت لـ Claude نفس system prompt بـ 8000 توكن مع كل request، إنت بتدفع تكلفة التوكنز دي 1000 مرة في اليوم بدون داعي. Prompt Caching بيخلّيك تدفع 25% من السعر بس على أول request، و10% بس على الـ requests اللي بعدها لمدة 5 دقايق. شرح للمستوى المتوسط بمثال أمين المكتبة للمبتدئ، تعريف علمي دقيق من توثيق Anthropic، كود Python شغّال على anthropic SDK 0.40+، أرقام مقاسة على 1000 سؤال (89.9% توفير)، 4 trade-offs حقيقية، وحالات لا تستخدم Caching فيها.
لو فاتورة Anthropic عندك بتعدّي $800 شهريًا وأكتر من 70% بتروح في إعادة إرسال نفس system prompt الطويل، Prompt Caching بسطر cache_control بينزّل الفاتورة لـ $80 على نفس الـ workload. مقال للمتوسط بمثال دروس المنهج للمبتدئ، تعريف علمي للـ KV cache و TTL، كود Python شغّال على Anthropic SDK 0.40+، أرقام مقاسة من workload 8000 request يومي، 4 trade-offs، ومتى لا تستخدمه.
لو تطبيقك بيبعت نفس الـ system prompt الطويل آلاف المرات يومياً لـ Claude، أنت بتدفع نفس التوكنز كل مرة من غير داعي. Prompt Caching بيخلّي Anthropic تخزّن البريفكس على سيرفرها وترجعه بـ 10% من السعر و80% أقل في زمن أول توكن. شرح للمتوسط بمثال مكتب البريد للمبتدئ، تعريف علمي لـ KV cache والـ ephemeral storage، كود Python شغّال على Anthropic SDK 0.40+، أرقام مقاسة من فاتورة 2000 request/يوم، الفرق بين 5-min و 1-hour cache، trade-offs الـ writes الزيادة والـ ordering، وحالات لا تستخدم فيها الـ caching أصلاً.