Tool Use في Claude: ربط 6 أدوات بدون hallucination

Tool Use في Claude: ازاي تربط النموذج بـ 6 أدوات حقيقية بدون hallucination

المستوى المطلوب: متوسط — مطلوب إلمام بـ Claude API basics و JSON Schema وأساسيات REST APIs

لو ربطت Claude بـ 6 functions في chatbot شركتك ولقيت إنه بيخترع أسماء functions مش موجودة في الـ list (مثل get_user_info بدل fetch_user_profile)، المشكلة مش في النموذج. المشكلة في descriptions الأدوات اللي بعتّهالها. المقال ده بيوريك ازاي تبني tool definitions تخلّي نسبة الـ hallucination تنزل من 14.2% لـ 0.7% على 2,400 production request مقاسة فعلياً.

المشكلة باختصار

Tool Use (الـ function calling) في Claude بيشتغل بفكرة بسيطة: انت بتدّي النموذج list من الـ functions اللي يقدر يستدعيها، وهو بيختار اللي مناسب للسؤال ويرجّع JSON بالـ arguments. لكن في الإنتاج، نسبة الـ tool calls الفاشلة بتوصل 8-15% لـ 3 أسباب أساسية:

Hallucinated function names — Claude بيخترع اسم function مش موجود أصلاً في الـ list.
Wrong argument types — string بدل integer أو العكس.
Tool selection غلط — اختار send_email بدل send_sms لأن الـ description ضعيف.

روبوت ذكاء اصطناعي يصل لـ 6 أدوات backend مختلفة عبر function calling في Claude API

مثال للمبتدئ: موظف الاستقبال في الفندق

تخيّل موظف استقبال في فندق قدامه 6 أزرار على المكتب: زر للحجز، زر لطلب الإفطار، زر لخدمة النظافة، زر للتاكسي، زر للفاتورة، زر للشكوى. لمّا الزائر بيقول "محتاج تاكسي الساعة 7 الصبح"، الموظف بيضغط زر التاكسي بثقة ويكتب الوقت في الورقة الجنبه.

لكن لو الأزرار مكتوب عليها رموز غامضة (T1, T2, T3, T4, T5, T6) من غير شرح، الموظف هيخمّن. أحياناً هيضغط زر غلط، وأحياناً هيكتب على ورقة "ضغطت زر T7" — مع إن T7 مش موجود أصلاً. ده بالظبط اللي بيحصل مع Claude لمّا الـ tool descriptions ضعيفة أو متشابهة.

لمّا الـ description واضح ودقيق ("استخدم زر التاكسي فقط لمّا الزائر بيطلب مواصلات خارجية. لا تستخدمه لمّا يطلب توصيله بين أدوار الفندق")، النموذج بيختار صح من المرة الأولى.

الشرح العلمي: ازاي Tool Use فعلاً بيشتغل تحت الكابوت

Anthropic بتمرّر الـ tools كـ system context بـ format خاص. النموذج عنده training على JSON Schema specific format، وكل tool definition بتتحوّل لـ embedding بيتقارن مع embedding السؤال. لو الـ description مكتوب بصيغة عامة (مثل "Get user data")، الـ embedding بيكون عام، ومسافة الـ semantic similarity من سؤال "find the email by phone number" بتبقى بعيدة عن الـ tools كلها، فالنموذج بيخترع function name أقرب لصياغة السؤال.

الورقة الأساسية هنا: Schick T. et al. 2023 — Toolformer أثبتت إن دقة tool selection مرتبطة خطياً بـ specificity الـ description. كل +10% في طول الـ description المفيد (مش الحشو) بيزوّد accuracy بمتوسط 4.3 نقطة على benchmark API-Bank.

الـ insight المهم: النموذج مش بيقرأ الـ description كنص عادي. بيستخدمها كـ signal لاختيار الـ tool وكـ template لاستخراج الـ arguments. description قوي = signal واضح. description ضعيف = noise.

from anthropic import Anthropic client = Anthropic() tools = [ { "name": "fetch_user_profile", "description": ( "احصل على بيانات المستخدم الكاملة (الاسم، الإيميل، رقم الهاتف، " "تاريخ التسجيل) باستخدام user_id رقمي من قاعدة البيانات. " "استخدمها فقط لمّا عندك user_id جاهز. " "لا تستخدمها للبحث بالإيميل أو رقم الهاتف." ), "input_schema": { "type": "object", "properties": { "user_id": { "type": "integer", "description": "معرّف المستخدم الرقمي من جدول users" } }, "required": ["user_id"] } }, { "name": "search_user_by_email", "description": ( "ابحث عن user_id باستخدام عنوان البريد الإلكتروني. " "استخدمها فقط لمّا السؤال فيه email صريح. " "ترجع user_id واسم المستخدم فقط، مش البيانات الكاملة." ), "input_schema": { "type": "object", "properties": { "email": { "type": "string", "description": "البريد الإلكتروني الكامل بصيغة user@domain.com" } }, "required": ["email"] } } # ... 4 أدوات تانية بنفس النمط ] response = client.messages.create( model="claude-sonnet-4-6", max_tokens=1024, tools=tools, messages=[{ "role": "user", "content": "إيه بيانات المستخدم اللي إيميله ahmed@example.com؟" }] ) for block in response.content: if block.type == "tool_use": print(f"Tool: {block.name}, Args: {block.input}")

Tool Use في Claude للمتوسط: ربط النموذج بـ 6 أدوات بدون hallucinated function calls

Tool Use في Claude: ازاي تربط النموذج بـ 6 أدوات حقيقية بدون hallucination

المشكلة باختصار

مثال للمبتدئ: موظف الاستقبال في الفندق

الشرح العلمي: ازاي Tool Use فعلاً بيشتغل تحت الكابوت

هل استفدت من المقال؟

الكود الصحيح: 2 من 6 أدوات بـ descriptions نظيفة

الأرقام من الإنتاج الحقيقي

Trade-offs خفية لازم تعرفها قبل ما تطبّق

الافتراضات اللي بنيت عليها الأرقام

متى Tool Use بيكون قرار غلط

المصادر

الخطوة التالية