الذكاء الاصطناعي

متوسط26 مايو 2026

Prompt Caching للمتوسط: نزّل فاتورة Claude API بـ 90% بسطر واحد

لو chatbot شركتك بيرجّع system prompt من 12K توكن في كل API call وفاتورة Claude بقت $4,200/شهر، انت بتدفع 90% منهم زيادة. سطر cache_control واحد في الـ payload بينزّل الفاتورة لـ $487 على نفس workload، بدون ما تلمس حرف في الكود التاني. مقال للمتوسط بمثال المدرّس وكتاب القواعد للمبتدئ، شرح علمي من Anthropic Prompt Caching Documentation، كود Python شغّال على anthropic SDK 0.49+ و Claude Sonnet 4.6، أرقام مقاسة من chatbot fintech عربي بـ 50K API call/يوم (توفير 88.4%)، 4 trade-offs خفية في الـ TTL والـ prefix والـ minimum tokens، ومتى Prompt Caching بيكون مضيعة وقت.

6 دقائق قراءة

LoRA: درّب نموذج 7B على كارت شاشة واحد بذاكرة 10 جيجا بدل 80

تقطير المعرفة: درّب نموذجًا صغيرًا يرث ذكاء نموذج كبير

الـ Reranking في RAG: ليه بحثك بيرجّع مستندات غلط وإزاي تصلحه

الكاش الدلالي للمتوسط: امنع 60% من نداءات LLM API لأسئلة مكررة بمعنى مختلف

وكلاء الذكاء الاصطناعي: إزاي حلقة ReAct بتمنع الـ LLM من الهلوسة

Function Calling للمتوسط: ليه شات بوتك بيخترع رقم الطلب بدل ما يجيبه من الـ API

Prompt Injection: ليه شات بوت شركتك بينفّذ أوامر العميل الخبيث

Reranking في RAG للمتوسط: ضاعف دقة الاسترجاع من 47% لـ 89%

Prompt Caching للمتوسط: نزّل فاتورة Claude API بـ 90% بسطر واحد