مقالات عملية مرتبة حسب المجال والمستوى، اختر المجال المناسب واقرأ من مستوى مبتدئ إلى محترف.
لو سألت ChatGPT أو Claude نفس السؤال وطلعت إجابات مختلفة، السبب إعداد اسمه Temperature. شرح للمبتدئ بمثال زرّ صوت الراديو، تعريف علمي لـ softmax و Nucleus Sampling من ورقة Holtzman 2020، كود Python شغّال يقيس الفرق (87% ← 31%)، Top-p بمثال، سيناريو شات بوت بأرقام، trade-offs، ومتى متلعبش في الإعدادات.
نفس المقال بالعربي بياخد ضعف إلى تلات أضعاف التوكنز اللي بياخدها بالإنجليزي، يعني بتدفع أكتر على نفس المعنى. شرح للمبتدئ بمثال تقطيع البيتزا، ثم تشريح علمي للـ Byte Pair Encoding، كود Python في 12 سطر يقيس الفرق بنفسك على tiktoken، أرقام حقيقية من ورقة Petrov 2023، trade-offs، ومتى الموضوع مايستاهلش تتعب فيه.
نموذج Llama 3 8B بدقته الكاملة محتاج 16GB رام و GPU غالية. الـ Quantization بينزّل الحجم لـ 4.5GB فيشتغل على لابتوب 8GB بمعالج عادي. شرح للمبتدئ بمثال صورة الكاميرا، إزاي تحوّل دقة الأوزان من 16-bit لـ 4-bit، أمر تشغيل واحد على Ollama، أرقام حقيقية للرام والجودة، 4 trade-offs خفية، ومتى الـ Quantization مش الحل.