المدونة

مقالات ودروس مجانية تساعدك في رحلتك التعليمية — من أساسيات البرمجة إلى أحدث التقنيات.

الكل DevOps بالعربي How To Make It Optimizing بالعربي أحدث أخبار التكنولوجيا الأوتوميشن البرمجة بالعربي الذكاء الاصطناعي

٨ مايو ٢٠٢٦

MCP للمتوسط: اربط Claude بأدواتك بدون integration code لكل أداة

لو فريقك بنى 12 tool integration لـ Claude في 6 شهور وكل أداة جديدة بتاخد يومين، إنت بتدفع ضعف الوقت اللي مفروض. شرح للمستوى المتوسط لبروتوكول MCP من Anthropic بمثال محوّل الكهرباء العالمي للمبتدئ، التعريف العلمي للـ JSON-RPC architecture، كود Python شغّال يبني MCP server لـ Jira في 28 سطر، أرقام مقاسة من إنتاج (يومين/أداة → 4 ساعات)، 4 trade-offs حقيقية، وحالات لا تستخدم MCP فيها أصلًا.

⏱ 5 دقائق قراءة

٨ مايو ٢٠٢٦

Extended Thinking في Claude للمتوسط: متى تستحق 5x التكلفة

لو Claude العادي بيحلّ 16% بس من مسائل AIME 24 وExtended Thinking بيرفعها لـ 61%، السؤال مش هل تفعّله — السؤال متى تدفع 5x التكلفة و8x الزمن. شرح للمتوسط بمثال طالب الامتحان للمبتدئ، تعريف علمي للـ thinking budget و reasoning tokens، كود Python شغّال على Anthropic SDK، أرقام مقاسة من AIME 24 و SWE-Bench و MATH-500، خمس trade-offs، وحالات لا تستخدم فيها التقنية أصلاً.

⏱ 6 دقائق قراءة

٨ مايو ٢٠٢٦

Chain-of-Thought Prompting للمبتدئ: ليه "فكر خطوة بخطوة" بترفع دقة LLM من 17% لـ 78%

لو سألت ChatGPT أو Claude مسألة فيها خطوتين حساب وطلعت غلط، المشكلة مش في الموديل. المشكلة إنك مطلبتش منه يفكر. كلمة واحدة في الـ prompt اسمها Chain-of-Thought بترفع الدقة على GSM8K من 17.7% لـ 78.7% حسب ورقة Wei et al. NeurIPS 2022. شرح للمبتدئ بمثال طالب الامتحان، تعريف علمي دقيق، كود Python شغّال على Anthropic SDK، أرقام مقاسة، 4 trade-offs، وحالات ما تستخدمش CoT فيها أصلاً.

⏱ 6 دقائق قراءة

٨ مايو ٢٠٢٦

KV Cache للمتوسط: ليه Context طويل في LLM بياكل GPU وازاي تقلله 4x

لو حاولت تشغّل Llama 3 70B على A100 80GB بـ 32K context وجاتلك CUDA OOM، المشكلة مش في وزن الموديل. المشكلة في الـ KV Cache اللي بيكبر خطيًا مع طول الـ context. مقال للمتوسط بمثال السكرتير، تعريف علمي للـ Key-Value matrices في self-attention، كود Python يقيس الاستهلاك فعليًا، أرقام مقاسة على Llama 3، أربع تقنيات تقليل (MQA, GQA, PagedAttention, KV Quantization)، 4 trade-offs، ومتى تتجاهل المشكلة دي أصلاً.

⏱ 7 دقائق قراءة

٨ مايو ٢٠٢٦

Batch API للمحترف: وفّر 50% من فاتورة Claude لو شغلك مش real-time

لو فاتورة Claude بتاعتك بتعدّي $1000 شهريًا و70% من شغلك تصنيف وتلخيص (مش رد فوري للمستخدم)، إنت بتدفع ضعف اللي مفروض. شرح كامل لـ Batch API بمثال شركة الشحن للمبتدئ، تعريف علمي دقيق، كود Python شغّال على anthropic SDK 0.40+، أرقام مقاسة (12K تذكرة عربية، $87 → $43.50)، 4 trade-offs حقيقية، ومتى لا تستخدم Batch API أصلاً.

⏱ 4 دقائق قراءة

٨ مايو ٢٠٢٦

هلوسة الموديلات للمبتدئ: ليه ChatGPT بيخترع حقائق وازاي توقفها

لو سألت ChatGPT عن ورقة بحثية ورجّعلك عنوان ومؤلفين ولينك، وبعدين دوّرت ما لقيتش الورقة، ده اسمه Hallucination. مقال للمبتدئ بمثال الطالب في الامتحان، تعريف علمي للـ probability distribution، 4 طرق عملية لتقليل الهلوسة 70%، أرقام من Vectara HHEM، كود Python شغّال على Anthropic SDK، ومتى الهلوسة بتبقى مفيدة فعلاً.

⏱ 7 دقائق قراءة

٨ مايو ٢٠٢٦

Tokenization للمبتدئ: ليه كلمة "استبشر" بتكلفك 5 توكنز في ChatGPT

لو فاتورة OpenAI عندك ضعف اللي توقعته رغم نفس عدد الـ requests، السبب غالبًا إن النص العربي بياكل توكنز 3-5 أضعاف الإنجليزي بسبب BPE Tokenization. مقال للمبتدئ بمثال آلة فرز العملة، تعريف علمي للـ Byte Pair Encoding من ورقة Sennrich 2016، كود tiktoken شغّال يقيس الفرق فعليًا (7 توكن إنجليزي مقابل 25 عربي)، أرقام من ورقة AraGPT2 و NeurIPS 2023، 4 trade-offs، ومتى متركّزش في الموضوع ده أصلاً.

⏱ 6 دقائق قراءة

٨ مايو ٢٠٢٦

Speculative Decoding للمحترف: ولّد توكنز LLM أسرع 3x بنفس الجودة

لو Llama 3 70B عندك بيولّد 32 توكن/ثانية على A100، الـ GPU مش مشغول حسابيًا. المشكلة memory bandwidth، والحل اسمه Speculative Decoding بيرفع المعدل لـ 91 توكن/ثانية بدون تغيير في الموديل ولا خسارة جودة. مقال للمحترف بمثال لجنة المراجعة للمبتدئ، تعريف علمي من ورقة Leviathan ICML 2023، كود vLLM 0.7+ شغّال، أرقام مقاسة من إنتاج، 4 trade-offs، وحالات لا تستخدمه فيها أصلاً.

⏱ 5 دقائق قراءة

٨ مايو ٢٠٢٦

LoRA للمتوسط: دربّ Llama 3 8B على بياناتك بـ 16GB GPU بدل 320GB

تدريب كامل لـ Llama 3 8B بيحتاج 320GB ذاكرة GPU وسيرفر بـ$60,000. LoRA بيدرّب نفس الموديل في 6 ساعات على RTX 4090 واحدة بـ 16GB، بفقد جودة 1-2% بس. مقال للمتوسط بمثال محرر الكتاب للمبتدئ، تعريف علمي للـ low-rank decomposition من ورقة Hu et al. 2021، كود PEFT + QLoRA شغّال، أرقام مقاسة على 12,000 مثال عربي، 4 trade-offs، ومتى لا تستخدم LoRA أصلاً.

⏱ 6 دقائق قراءة

مدونة أحمد حايس

💡

ملخص سريع

مدونة أحمد حايس تجيب عن أسئلة مثل كيف أتعلم البرمجة أو التكنولوجيا أو الذكاء الاصطناعي، وتحوّل المفاهيم التقنية إلى مقالات عربية عملية واضحة.

الأسئلة الشائعة

كيف أتعلم التكنولوجيا أو البرمجة من المقالات؟+