Temperature و Top-p: تحكّم في عشوائية الذكاء الاصطناعي

المستوى: مبتدئ — لو بتستخدم ChatGPT أو Claude ومش فاهم يعني إيه Temperature و Top-p، المقال ده ليك.

Temperature و Top-p: ليه نفس السؤال بيرد عليه الـ AI كل مرة بإجابة مختلفة

لو سألت نفس النموذج نفس السؤال 3 مرات وطلعت 3 إجابات مختلفة، ده مش عطل. ده إعداد اسمه Temperature بتقدر تتحكم فيه. بعد المقال ده هتعرف تخلّي النموذج «ثابت ودقيق» أو «متنوّع ومبدع»، وامتى تختار كل واحد.

المشكلة باختصار

النموذج اللغوي مش بيختار الكلمة التالية مرة واحدة وخلاص. هو بيحسب احتمال لكل كلمة ممكنة، وبعدين بيسحب واحدة من التوزيع ده. لو السحب فيه عشوائية، الإجابة بتختلف كل مرة. الإعدادين اللي بيتحكموا في العشوائية دي هما Temperature و Top-p.

رسم مفاهيمي لنموذج لغوي يختار الكلمة التالية من بين عدة احتمالات بأوزان مختلفة

الـ Temperature بمثال الراديو

تخيّل راديو قديم بزرّ صوت. لو نزّلت الصوت لأقصى حد، بتسمع المحطة الأقوى بس وكل اللي تحتها بيختفي. لو علّيت الصوت، المحطات الضعيفة بتبان ومعاها تشويش. الـ Temperature هو زرّ الصوت ده بالظبط: بيقرّر قد إيه النموذج «يسمع» الكلمات ضعيفة الاحتمال.

دلوقتي بالتعريف الدقيق: النموذج بيطلّع لكل كلمة رقم اسمه logit. دالة اسمها softmax بتحوّل الأرقام دي لاحتمالات مجموعها 100%. الـ Temperature بيتقسّم على الـ logits قبل الـ softmax. قيمة قليلة (0.3 مثلاً) بتكبّر الفرق بين الكلمات، فالأقوى تاخد نصيب أكبر. قيمة عالية (1.8) بتقرّب الكلمات من بعضها، فالعشوائية بتزيد.

Python

import math

def softmax(logits, temperature):
    scaled = [x / temperature for x in logits]
    m = max(scaled)
    exps = [math.exp(x - m) for x in scaled]
    total = sum(exps)
    return [e / total for e in exps]

logits = [4.2, 3.6, 2.9, 2.2, 1.7, 1.1, 0.6, 0.2]

for t in (0.3, 1.0, 1.8):
    probs = softmax(logits, t)
    print(f"T={t}: أعلى كلمة تاخد {probs[0]*100:.0f}%")

# T=0.3: أعلى كلمة تاخد 87%
# T=1.0: أعلى كلمة تاخد 47%
# T=1.8: أعلى كلمة تاخد 31%

نفس الأرقام بالظبط، غيّرنا الـ Temperature بس. الكلمة الأقوى نزلت من 87% لـ 31%، يعني الكلمات التانية بقى ليها فرصة أكبر إنها تتختار.

Top-p (Nucleus Sampling): نقص الذيل

لوحة بيانات تعرض توزيعات ورسوم بيانية تمثل احتمالات اختيار الكلمات في نموذج لغوي

الـ Temperature بيتحكم في شكل التوزيع. الـ Top-p بيتحكم في عدد المرشحين. الفكرة بمثال بسيط: عندك ممكن 50 ألف كلمة محتملة، أغلبها احتمالها شبه صفر — دي اسمها «الذيل». إنك تسيب الذيل ده مفتوح ممكن يطلّع كلمة غريبة فجأة وسط كلام سليم.

بالتعريف العلمي: Top-p (أو Nucleus Sampling، من ورقة Holtzman وزملائه سنة 2020) بترتّب الكلمات من الأعلى احتمالاً للأقل، وتجمع احتمالاتها لحد ما توصل للنسبة اللي إنت حددتها. لو ، النموذج بياخد أقل عدد كلمات مجموع احتمالها 90% ويرمي الباقي. العدد ده بيتغيّر من خطوة لخطوة: ساعات 3 كلمات، وساعات 200.

Temperature و Top-p للمبتدئ: ليه نفس السؤال بيرد عليه الـ AI كل مرة بإجابة مختلفة

Temperature و Top-p: ليه نفس السؤال بيرد عليه الـ AI كل مرة بإجابة مختلفة

المشكلة باختصار

الـ Temperature بمثال الراديو

Top-p (Nucleus Sampling): نقص الذيل

هل استفدت من المقال؟

سيناريو واقعي + أرقام

الـ trade-offs

متى متغيّرش الإعدادات دي

الخطوة التالية

المصادر