مقالات عملية مرتبة حسب المجال والمستوى، اختر المجال المناسب واقرأ من مستوى مبتدئ إلى محترف.
لو فاتورة OpenAI عندك ضعف اللي توقعته رغم نفس عدد الـ requests، السبب غالبًا إن النص العربي بياكل توكنز 3-5 أضعاف الإنجليزي بسبب BPE Tokenization. مقال للمبتدئ بمثال آلة فرز العملة، تعريف علمي للـ Byte Pair Encoding من ورقة Sennrich 2016، كود tiktoken شغّال يقيس الفرق فعليًا (7 توكن إنجليزي مقابل 25 عربي)، أرقام من ورقة AraGPT2 و NeurIPS 2023، 4 trade-offs، ومتى متركّزش في الموضوع ده أصلاً.
لو SELECT بسيط على جدول مليون صف بياخد 8 ثواني، المشكلة مش في السيرفر. الـ Index بسطر SQL واحد بينزّل الزمن لـ 5ms، 1690x أسرع. شرح للمبتدئ بمثال القاموس، تعريف علمي للـ B-tree، كود PostgreSQL 16 شغّال مع EXPLAIN ANALYZE، أرقام مقاسة، 3 trade-offs حقيقية (مساحة، بطء الكتابة، صيانة)، 4 حالات Index بيشتغل فيها وحالات بيفشل، ومتى ما تستخدمش Index أصلاً.
سكربت bash بسيط بـ pg_dump و aws-cli وsystemd timer يعمل نسخة احتياطية يومية لقاعدة البيانات على S3 في حساب منفصل، مع خطة استرجاع مُختبرة بتشتغل في أقل من 4 دقايق على DB حجمها 8GB. دليل عملي للمبتدئ مع الكود الكامل، تكلفة شهرية محسوبة، ومتى لا تستخدم هذه الطريقة أصلاً.
لو دالة recursive عندك في Node بتكسر السيرفر مع inputs كبيرة وبيرجع لك Maximum call stack size exceeded، المشكلة مش في الكود — المشكلة في حدود الـ Call Stack نفسه. شرح للمبتدئ بمثال طاقم الأطباق، تعريف علمي دقيق لـ V8 frames، كود JavaScript شغّال يقيس الحد الأقصى على Node 22، 3 حلول عملية (iteration، trampoline، --stack-size)، أرقام مقاسة فعلياً، trade-offs، وحالات لا تستخدم recursion فيها.
لو بتفتح 3 شاشات terminal كل صبح علشان تشغّل التطبيق وقاعدة البيانات والـ Redis، Docker Compose بيلخّص ده كله في ملف واحد وأمر اسمه docker compose up. شرح للمبتدئ بمثال الأوركسترا، تعريف علمي دقيق، ملف yml كامل في 12 سطر شغّال على Docker 25، أرقام مقاسة (4:12 د → 28 ث)، الفخ الكلاسيكي depends_on، healthcheck الصحيح، trade-offs الإنتاج، ومتى لا تستخدمه.
مقال للمبتدئ يشرح فكرة الـ Embeddings بمثال المكتبة، تعريف علمي للـ Cosine Similarity من ورقة Word2Vec، كود Python شغّال على sentence-transformers، أرقام مقاسة من BEIR Benchmark (62% → 84%)، 4 trade-offs حقيقية، وحالات لا تستخدم فيها الـ Embeddings.
لو كتبت "حاسوب" والمقال فيه "كمبيوتر"، البحث الكلاسيكي بيرجّع صفر. Embeddings بتحوّل الكلام لمتجهات أرقام بتعكس المعنى مش الحروف. مقال للمبتدئ بمثال خريطة المدينة، تعريف علمي للـ cosine similarity، كود Python شغّال على sentence-transformers + multilingual-e5، أرقام مقاسة (71% vs 38% على BM25)، 4 trade-offs حقيقية، ومتى البحث الكلاسيكي يكفيك.
لو بتدفع $0.20 لكل صورة على remove.bg و موقعك بيرفع 500 صورة شهريًا، أنت بتحرق $100 في الشهر بدون داعي. مكتبة rembg المفتوحة بتشيل الخلفية محليًا في 1.4 ثانية على CPU عادي بدون API key وبدون إنترنت. مقال للمبتدئ بمثال المخ البشري لفهم الـ segmentation، تعريف علمي لـ U²-Net، كود Python شغّال في 50 سطر يعالج فولدر كامل، أرقام مقاسة على Mac M2 و i7، trade-offs الجودة، ومتى لا تستخدم الحل المحلي أصلاً.
لو سألت Claude أو ChatGPT عن "أفضل أكل للقطط" والموديل رجّعلك نتيجة فيها "هريرة" أو "قطة صغيرة" رغم إن السؤال ما فيهوش الكلمتين، ده شغل تقنية اسمها Embeddings. مقال للمبتدئ بمثال خريطة المدينة، تعريف علمي للـ vector space و cosine similarity، كود Python شغّال على sentence-transformers، أرقام مقاسة من إنتاج (recall@10 من 78% لـ 96%)، 4 trade-offs حقيقية، وحالات لا تستخدم فيها embeddings أصلاً.