مقالات ودروس مجانية تساعدك في رحلتك التعليمية — من أساسيات البرمجة إلى أحدث التقنيات.
لو فريقك بنى 12 tool integration لـ Claude في 6 شهور وكل أداة جديدة بتاخد يومين، إنت بتدفع ضعف الوقت اللي مفروض. شرح للمستوى المتوسط لبروتوكول MCP من Anthropic بمثال محوّل الكهرباء العالمي للمبتدئ، التعريف العلمي للـ JSON-RPC architecture، كود Python شغّال يبني MCP server لـ Jira في 28 سطر، أرقام مقاسة من إنتاج (يومين/أداة → 4 ساعات)، 4 trade-offs حقيقية، وحالات لا تستخدم MCP فيها أصلًا.
لو Claude العادي بيحلّ 16% بس من مسائل AIME 24 وExtended Thinking بيرفعها لـ 61%، السؤال مش هل تفعّله — السؤال متى تدفع 5x التكلفة و8x الزمن. شرح للمتوسط بمثال طالب الامتحان للمبتدئ، تعريف علمي للـ thinking budget و reasoning tokens، كود Python شغّال على Anthropic SDK، أرقام مقاسة من AIME 24 و SWE-Bench و MATH-500، خمس trade-offs، وحالات لا تستخدم فيها التقنية أصلاً.
لو سألت ChatGPT أو Claude مسألة فيها خطوتين حساب وطلعت غلط، المشكلة مش في الموديل. المشكلة إنك مطلبتش منه يفكر. كلمة واحدة في الـ prompt اسمها Chain-of-Thought بترفع الدقة على GSM8K من 17.7% لـ 78.7% حسب ورقة Wei et al. NeurIPS 2022. شرح للمبتدئ بمثال طالب الامتحان، تعريف علمي دقيق، كود Python شغّال على Anthropic SDK، أرقام مقاسة، 4 trade-offs، وحالات ما تستخدمش CoT فيها أصلاً.
لو حاولت تشغّل Llama 3 70B على A100 80GB بـ 32K context وجاتلك CUDA OOM، المشكلة مش في وزن الموديل. المشكلة في الـ KV Cache اللي بيكبر خطيًا مع طول الـ context. مقال للمتوسط بمثال السكرتير، تعريف علمي للـ Key-Value matrices في self-attention، كود Python يقيس الاستهلاك فعليًا، أرقام مقاسة على Llama 3، أربع تقنيات تقليل (MQA, GQA, PagedAttention, KV Quantization)، 4 trade-offs، ومتى تتجاهل المشكلة دي أصلاً.
لو فاتورة Claude بتاعتك بتعدّي $1000 شهريًا و70% من شغلك تصنيف وتلخيص (مش رد فوري للمستخدم)، إنت بتدفع ضعف اللي مفروض. شرح كامل لـ Batch API بمثال شركة الشحن للمبتدئ، تعريف علمي دقيق، كود Python شغّال على anthropic SDK 0.40+، أرقام مقاسة (12K تذكرة عربية، $87 → $43.50)، 4 trade-offs حقيقية، ومتى لا تستخدم Batch API أصلاً.
لو سألت ChatGPT عن ورقة بحثية ورجّعلك عنوان ومؤلفين ولينك، وبعدين دوّرت ما لقيتش الورقة، ده اسمه Hallucination. مقال للمبتدئ بمثال الطالب في الامتحان، تعريف علمي للـ probability distribution، 4 طرق عملية لتقليل الهلوسة 70%، أرقام من Vectara HHEM، كود Python شغّال على Anthropic SDK، ومتى الهلوسة بتبقى مفيدة فعلاً.
لو فاتورة OpenAI عندك ضعف اللي توقعته رغم نفس عدد الـ requests، السبب غالبًا إن النص العربي بياكل توكنز 3-5 أضعاف الإنجليزي بسبب BPE Tokenization. مقال للمبتدئ بمثال آلة فرز العملة، تعريف علمي للـ Byte Pair Encoding من ورقة Sennrich 2016، كود tiktoken شغّال يقيس الفرق فعليًا (7 توكن إنجليزي مقابل 25 عربي)، أرقام من ورقة AraGPT2 و NeurIPS 2023، 4 trade-offs، ومتى متركّزش في الموضوع ده أصلاً.
لو Llama 3 70B عندك بيولّد 32 توكن/ثانية على A100، الـ GPU مش مشغول حسابيًا. المشكلة memory bandwidth، والحل اسمه Speculative Decoding بيرفع المعدل لـ 91 توكن/ثانية بدون تغيير في الموديل ولا خسارة جودة. مقال للمحترف بمثال لجنة المراجعة للمبتدئ، تعريف علمي من ورقة Leviathan ICML 2023، كود vLLM 0.7+ شغّال، أرقام مقاسة من إنتاج، 4 trade-offs، وحالات لا تستخدمه فيها أصلاً.
تدريب كامل لـ Llama 3 8B بيحتاج 320GB ذاكرة GPU وسيرفر بـ$60,000. LoRA بيدرّب نفس الموديل في 6 ساعات على RTX 4090 واحدة بـ 16GB، بفقد جودة 1-2% بس. مقال للمتوسط بمثال محرر الكتاب للمبتدئ، تعريف علمي للـ low-rank decomposition من ورقة Hu et al. 2021، كود PEFT + QLoRA شغّال، أرقام مقاسة على 12,000 مثال عربي، 4 trade-offs، ومتى لا تستخدم LoRA أصلاً.
مدونة أحمد حايس تجيب عن أسئلة مثل كيف أتعلم البرمجة أو التكنولوجيا أو الذكاء الاصطناعي، وتحوّل المفاهيم التقنية إلى مقالات عربية عملية واضحة.