المدونة

مقالات عملية مرتبة حسب المجال والمستوى، اختر المجال المناسب واقرأ من مستوى مبتدئ إلى محترف.

LLM-as-a-Judge للمتوسط: قيّم 10,000 إجابة عربية في ساعة بدل 3 أسابيع مراجعة بشرية

لو فريقك بيراجع مخرجات شات بوت يدويًا ومش قادر يلحق على 10,000 رد شهريًا، LLM-as-a-Judge بيخلّي Claude Haiku 4.5 يقيّم الإجابات بدقة 84% مقارنة بالبشر، بتكلفة 4.20$ بدل 1,800$. مقال للمتوسط بمثال مفتش الجودة للمبتدئ، شرح علمي من ورقة Zheng et al. 2023 (MT-Bench)، كود Python في 22 سطر شغّال على anthropic SDK 0.49+، أرقام مقاسة على 2,400 إجابة دعم فني عربية، 4 trade-offs خفية، ومتى الـ judge بيغش بدل ما يحكم.

7 دقائق قراءة

متوسط١١ مايو ٢٠٢٦

Prompt Caching للمتوسط: نزّل فاتورة Claude API 90% بدون لمس prompt

لو بتبعت نفس الـ system prompt 4,200 token مع كل استدعاء على Claude، انت بتدفع 90% من فاتورتك في tokens بتتكرّر بدون فايدة. Prompt Caching بـ سطرين Python بيرجّع نفس الـ prefix من cache بسعر 10% فقط. مقال للمتوسط بمثال الباريستا للمبتدئ، شرح علمي للـ KV-cache من ورقة PagedAttention 2023، كود شغّال على anthropic SDK 0.45+ و Claude Sonnet 4.6، أرقام مقاسة على chatbot دعم عربي بـ 1,200 طلب/يوم (الفاتورة من 453$ لـ 49.7$ شهرياً، TTFT من 1.84 ثانية لـ 380ms)، 4 trade-offs خفية، ومتى Caching بيكون كارثة بدل ما يوفّر.

7 دقائق قراءة

متوسط١١ مايو ٢٠٢٦

Prompt Caching للمتوسط: وفّر 90% من فاتورة Claude API بسطر واحد

لو فاتورة Claude API بتاعتك وصلت $1,247 شهرياً على شات بوت بـ 18,000 محادثة، انت بتدفع تمن نفس الـ 6,500 token من الـ system prompt 18,000 مرة. Prompt Caching بيخفّض الرقم لـ $127 على نفس الـ workload بدون تغيير جودة. مقال للمتوسط بمثال موظف الاستقبال للمبتدئ، تعريف علمي للـ KV Cache من ورقة Vaswani 2017، كود Python شغّال على anthropic SDK 0.49+ و Claude Sonnet 4.6، أرقام مقاسة على 50,000 طلب دعم فني عربي، 4 trade-offs خفية، ومتى Caching مضيعة وقت.

8 دقائق قراءة

متوسط١١ مايو ٢٠٢٦

Prompt Caching في Claude للمتوسط: ادفع 10% بس على نفس الـ System Prompt

لو فاتورة Claude API طلعت $1,400 وأنت بتبعت نفس الـ system prompt الطويل في كل request، أنت بتدفع 90% أكتر من اللازم. مقال للمتوسط بمثال الباريستا للمبتدئ، شرح KV cache من ورقة Vaswani 2017، كود Python شغّال على anthropic SDK 0.45+، أرقام مقاسة على chatbot عربي بـ 8,200 محادثة/يوم (توفير 84.3% شهريًا)، 4 trade-offs خفية، ومتى Caching بيكون مضيعة وقت.

5 دقائق قراءة

متوسط١١ مايو ٢٠٢٦

MCP للمتوسط: ربط 12 أداة بـ Claude في 4 ساعات بدل 3 أسابيع Integration

Model Context Protocol بقى المعيار الفعلي لتوصيل الأدوات بنماذج LLM في 2026. مقال للمتوسط بمثال USB-C للأجهزة، تعريف علمي مبني على spec الـ JSON-RPC، خطوات عملية لربط Zendesk + PostgreSQL + GitHub، أرقام مقاسة على 1,800 تذكرة دعم عربية (وقت المعالجة من 14 دقيقة لـ 3.4 دقيقة)، 4 trade-offs خفية، ومتى MCP بيكون مبالغة هندسية.

7 دقائق قراءة

متوسط١١ مايو ٢٠٢٦

INP و scheduler.yield للمتوسط: نزّل زمن الكليك من 320ms لـ 80ms

لو زرار dashboard بياخد 320ms قبل ما يستجيب، الموقع مش بطيء — هو شغّال long task بيقفل main thread. scheduler.yield في Chrome 129 بتنزّل INP لـ 80ms بدون Web Worker، وبتحفظ ترتيبك في Search لأن INP بقى رسمي في Core Web Vitals من مارس 2024.

5 دقائق قراءة

متوسط١١ مايو ٢٠٢٦

ArgoCD للمتوسط: ابدأ GitOps حقيقي وامسح آخر deploy.sh في 12 دقيقة

لو فريقك لسه بيـ kubectl apply يدوي أو بيشغّل deploy.sh من CI بصلاحيات admin، حالة الإنتاج مش متطابقة مع git. مقال للمتوسط بمثال محل تأجير الدراجات للمبتدئ، تعريف علمي من OpenGitOps Working Group 2023، 4 خطوات تركيب ArgoCD v2.13 على EKS 1.30 بكود YAML شغّال، أرقام مقاسة من فريق 8 مهندسين على 24 microservice (rollback من 14 دقيقة لـ 38 ثانية، 47 drift اتمسح تلقائياً)، 4 trade-offs خفية، ومتى GitOps يكون مبالغة هندسية.

7 دقائق قراءة

متوسط١١ مايو ٢٠٢٦

OpenTelemetry للمتوسط: تتبع رحلة الطلب عبر 14 microservice وامسك الـ bottleneck في دقيقتين

لو الطلب في تطبيقك بيمر على 14 microservice وفجأة P95 طلع من 280ms لـ 3.2 ثانية، الـ logs مش هتقولك المشكلة فين. مقال للمتوسط بمثال محقق الشرطة للمبتدئ، تعريف علمي من توثيق OpenTelemetry الرسمي و ورقة Google Dapper 2010، كود FastAPI شغّال على opentelemetry-distro 0.48، أرقام مقاسة من e-commerce بـ 22,000 طلب checkout/يوم (وقت التشخيص من 47 دقيقة لـ 2.3 دقيقة)، 4 trade-offs خفية، ومتى OTel مبالغة هندسية.

7 دقائق قراءة

متوسط١١ مايو ٢٠٢٦

Reranking للمتوسط: ارفع دقة RAG العربي من 71% لـ 94% بـ Cross-Encoder

لو RAG بتاعك بيرجّع 10 نتائج فيهم 3 مفيدين والباقي ضجيج، المشكلة مش في الـ embeddings — هي في إن Bi-Encoder بيخمّن. مقال للمتوسط بمثال المكتبي للمبتدئ، تعريف علمي من ورقة Sentence-BERT (Reimers 2019)، كود Python في 18 سطر شغّال على Cohere rerank-multilingual-v3.0 و BGE-reranker-v2-m3، أرقام مقاسة على 24,000 chunk عربي (Recall@10 من 71.2% لـ 93.8%)، 4 trade-offs خفية، ومتى Reranking مضيعة وقت.

6 دقائق قراءة