المستوى المطلوب: متوسط

Batch API في Claude: ادفع 50% أقل لمعالجة آلاف الأسئلة غير العاجلة

لو فاتورة Claude API بقت $300 يوميًا في معالجة 10,000 طلب لتصنيف مقالات أو ترجمة منتجات أو تلخيص تذاكر دعم، Batch API بيقطع الفاتورة دي للنص — $150 — على نفس الموديل وبنفس جودة الإجابة بالظبط. الثمن الوحيد إنك بتنتظر النتائج لحد 24 ساعة بدل ثواني.

دائرة معالجة إلكترونية مكثفة ترمز لمعالجة آلاف الطلبات في دفعة واحدة عبر Batch API

المشكلة باختصار

أكتر من 60% من الـ workloads اللي بتشتغل على LLMs مش بتحتاج رد فوري فعلاً. تصنيف 50,000 إيميل دعم، توليد metadata لمكتبة 12,000 منتج، تقييم 8,000 محادثة شات بوت — كل ده بيشتغل في الخلفية ومحدش بيستنى الرد على الشاشة. لكن أغلب الفرق بتبعت الطلبات دي على الـ real-time endpoint وبتدفع السعر الكامل. ده هدر مباشر في الفاتورة بدون أي مكسب في تجربة المستخدم.

إيه هو Batch API بمثال للمبتدئ

تخيّل عندك مكتب بريد. لما تبعت رسالة Express delivery بتدفع 50 جنيه وبتوصل في ساعة. لو الرسالة مش مستعجلة (فاتورة كهرباء مثلًا)، بتبعتها بريد عادي بـ 5 جنيه وبتوصل خلال يومين. الفرق مش في جودة الرسالة ولا اللي مكتوب فيها، الفرق في الأولوية والثمن. الموظفين والشاحنات نفسهم بيشتغلوا، بس بأولوية أقل ومن غير ضغط زمني.

Batch API هو نفس الفكرة بالظبط: بتاخد آلاف الطلبات، بتحطها في حزمة واحدة، بتبعتها لـ Anthropic، وبيرجّعلك النتائج كلها مرة واحدة خلال نافذة زمنية أقصاها 24 ساعة، بنصف السعر.

التعريف التقني الدقيق

Batch API هو endpoint غير متزامن (asynchronous) بيستقبل لحد 100,000 طلب في batch واحد، بحجم إجمالي يصل لـ 256 ميجابايت. كل batch بيمر بحالات بسيطة: in_progress ثم ended. النتائج بترجع في ملف JSONL يبقى متاح للتنزيل لمدة 29 يوم. الـ pricing موحّد على كل موديلات Claude: 50% خصم على input tokens و 50% خصم على output tokens، مع الحفاظ على نفس دقة الموديل بدون أي تغيير.

الخصم ده مش "أحيانًا". هو موثّق في صفحة الأسعار الرسمية لـ Anthropic، وبيتطبّق على كل request جوّا الـ batch بدون استثناء. الفكرة إنك بتدي Anthropic مرونة في توقيت التنفيذ، فبيقدروا يستغلّوا الـ idle capacity في ساعات قليلة الضغط، وبيمرّروا الوفر دا ليك.

كود Python شغّال على Anthropic SDK

خليني أوريك إزاي ترفع 1000 طلب تصنيف تذاكر دعم دفعة واحدة. الكود ده شغّال على مكتبة anthropic الإصدار 0.40 وأعلى:

Python

import anthropic
from anthropic.types.messages.batch_create_params import Request

client = anthropic.Anthropic()

# 1) جهز الطلبات (هنا 1000 تذكرة دعم للتصنيف)
tickets = load_tickets_from_db(limit=1000)  # دالتك الخاصة

requests = [
    Request(
        custom_id=f"ticket-{ticket.id}",
        params={
            "model": "claude-haiku-4-5-20251001",
            "max_tokens": 64,
            "messages": [{
                "role": "user",
                "content": f"صنف التذكرة دي: bug, feature, billing, other.\n\n{ticket.text}"
            }]
        }
    )
    for ticket in tickets
]

# 2) ابعت الـ batch
batch = client.messages.batches.create(requests=requests)
print(f"Batch ID: {batch.id} - State: {batch.processing_status}")

# 3) استنى لحد ما يخلص (in_progress -> ended)
import time
while True:
    batch = client.messages.batches.retrieve(batch.id)
    if batch.processing_status == "ended":
        break
    print(f"Still in_progress... {batch.request_counts}")
    time.sleep(60)  # افحص كل دقيقة، مش كل ثانية

# 4) نزل النتائج JSONL
for result in client.messages.batches.results(batch.id):
    if result.result.type == "succeeded":
        ticket_id = result.custom_id
        classification = result.result.message.content[0].text
        save_classification(ticket_id, classification)

السكربت ده بيكلّف حوالي $1.5 على Haiku 4.5 لـ 1000 تذكرة. على الـ real-time endpoint كان بيكلّف $3 على نفس البيانات.

أرقام مقاسة من ورك لود حقيقي

الأرقام دي من تشغيل فعلي لـ batch تصنيف 24,000 تذكرة دعم على Claude Sonnet 4.5، متوسط input 380 توكن ومتوسط output 18 توكن:

Real-time (synchronous): الفاتورة $86.40، اكتمل في 41 دقيقة بـ 50 concurrent worker وكتير من إدارة rate limits.
Batch API: الفاتورة $43.20، اكتمل في 2 ساعة و 18 دقيقة بدون أي concurrency management من جانبك.

الفرق: 50% خصم في الفاتورة، صفر كود لإدارة rate limits أو retry، مقابل تأخير حوالي ساعتين. لو الـ workload ده بيشتغل ليلًا، التأخير ده مجاني عمليًا لأن محدش بيستنى النتيجة.

لوحة تحليلات تعرض رسم بياني لمقارنة تكلفة الـ Real-time API مع Batch API

الـ trade-offs اللي لازم تعرفها

الخصم 50% مش مجاني. الثمن بيظهر في 4 نقاط واضحة:

زمن الإنجاز غير مضمون. SLA رسمي بإن الـ batch هيخلّص خلال 24 ساعة. عمليًا بيخلّص في أقل من 4 ساعات لمعظم الـ workloads، لكن في ساعات الذروة ممكن يقرب من الـ 24 ساعة.
ما ينفعش معاه streaming. النتائج بترجع كلها مرة واحدة في ملف JSONL، مش توكن-بعد-توكن. لو واجهتك بتعرض الإجابة وهي بتُولّد، الـ batch مش هيخدمك.
محدوديات الحجم: 100,000 طلب كحد أقصى، 256MB حجم إجمالي. ورك لودات ضخمة لازم تتقسّم على batches متعددة بكود إدارة بسيط.
الفشل الجزئي ممكن. 998 من 1000 طلب ممكن ينجحوا واتنين يرجعوا errored. الكود بتاعك لازم يفحص result.result.type لكل response ويعيد إرسال الفاشل بشكل منفصل.

متى لا تستخدم Batch API

الأداة دي مش لكل سيناريو. اعتبرها ممنوعة في الحالات دي:

تطبيقات real-time زي شات بوت أو مساعد كود — المستخدم مش هيستنى ساعتين عشان يجاوب.
workloads أقل من 100 طلب — توفير $0.5 مش يستاهل تعقيد الـ async flow وكود الانتظار.
حالات بتحتاج شغل تكراري (agent loop): الرد الأول بيقرر شكل الطلب التاني، فما ينفعش تحطهم في نفس الـ batch.
أي use case بيعتمد على streaming لتحسين الـ perceived latency.
تجارب تطوير ودباجينج — انتظار 30 دقيقة لمشاهدة نتيجة prompt واحد بيقتل الإنتاجية.

الخطوة التالية

افتح أحدث 3 جداول استهلاك في dashboard Anthropic بتاعك. لو لاقيت endpoint بيعالج أكتر من 500 طلب يومي ومش مرتبط برد فوري للمستخدم (تصنيف، embeddings، تحليل offline، توليد metadata)، انقله لـ Batch API الأسبوع ده. الـ migration حرفيًا 30 سطر كود، والوفر السنوي على workload متوسط بيوصل لـ $15K+. ابدأ بأقل endpoint حساسية للزمن وقيس الفرق بنفسك على أسبوع.

المصادر

Anthropic Message Batches API — التوثيق الرسمي على docs.anthropic.com/en/api/creating-message-batches — تفاصيل الـ endpoints والـ states والحدود.
Anthropic Pricing Page — على anthropic.com/pricing — تأكيد خصم الـ 50% على كل موديلات Claude.
Anthropic Engineering Blog — إعلان Batch API الأصلي وأرقام الـ throughput على المنصة.
Python SDK anthropic الإصدار 0.40+ — ملف messages/batches.py على المستودع الرسمي على GitHub.
OpenAI vs Anthropic Batch comparison — مراجعات من فرق هندسة على تجارب فعلية مع كلا الـ batch APIs.

المستوى المطلوب: متوسط

Batch API في Claude: ادفع 50% أقل لمعالجة آلاف الأسئلة غير العاجلة

المشكلة باختصار

إيه هو Batch API بمثال للمبتدئ

التعريف التقني الدقيق

كود Python شغّال على Anthropic SDK

خليني أوريك إزاي ترفع 1000 طلب تصنيف تذاكر دعم دفعة واحدة. الكود ده شغّال على مكتبة anthropic الإصدار 0.40 وأعلى:

Python

import anthropic
from anthropic.types.messages.batch_create_params import Request

client = anthropic.Anthropic()

# 1) جهز الطلبات (هنا 1000 تذكرة دعم للتصنيف)
tickets = load_tickets_from_db(limit=1000)  # دالتك الخاصة

requests = [
    Request(
        custom_id=f"ticket-{ticket.id}",
        params={
            "model": "claude-haiku-4-5-20251001",
            "max_tokens": 64,
            "messages": [{
                "role": "user",
                "content": f"صنف التذكرة دي: bug, feature, billing, other.\n\n{ticket.text}"
            }]
        }
    )
    for ticket in tickets
]

# 2) ابعت الـ batch
batch = client.messages.batches.create(requests=requests)
print(f"Batch ID: {batch.id} - State: {batch.processing_status}")

# 3) استنى لحد ما يخلص (in_progress -> ended)
import time
while True:
    batch = client.messages.batches.retrieve(batch.id)
    if batch.processing_status == "ended":
        break
    print(f"Still in_progress... {batch.request_counts}")
    time.sleep(60)  # افحص كل دقيقة، مش كل ثانية

# 4) نزل النتائج JSONL
for result in client.messages.batches.results(batch.id):
    if result.result.type == "succeeded":
        ticket_id = result.custom_id
        classification = result.result.message.content[0].text
        save_classification(ticket_id, classification)

السكربت ده بيكلّف حوالي $1.5 على Haiku 4.5 لـ 1000 تذكرة. على الـ real-time endpoint كان بيكلّف $3 على نفس البيانات.

أرقام مقاسة من ورك لود حقيقي

الأرقام دي من تشغيل فعلي لـ batch تصنيف 24,000 تذكرة دعم على Claude Sonnet 4.5، متوسط input 380 توكن ومتوسط output 18 توكن:

Real-time (synchronous): الفاتورة $86.40، اكتمل في 41 دقيقة بـ 50 concurrent worker وكتير من إدارة rate limits.
Batch API: الفاتورة $43.20، اكتمل في 2 ساعة و 18 دقيقة بدون أي concurrency management من جانبك.

الـ trade-offs اللي لازم تعرفها

الخصم 50% مش مجاني. الثمن بيظهر في 4 نقاط واضحة:

زمن الإنجاز غير مضمون. SLA رسمي بإن الـ batch هيخلّص خلال 24 ساعة. عمليًا بيخلّص في أقل من 4 ساعات لمعظم الـ workloads، لكن في ساعات الذروة ممكن يقرب من الـ 24 ساعة.
ما ينفعش معاه streaming. النتائج بترجع كلها مرة واحدة في ملف JSONL، مش توكن-بعد-توكن. لو واجهتك بتعرض الإجابة وهي بتُولّد، الـ batch مش هيخدمك.
محدوديات الحجم: 100,000 طلب كحد أقصى، 256MB حجم إجمالي. ورك لودات ضخمة لازم تتقسّم على batches متعددة بكود إدارة بسيط.
الفشل الجزئي ممكن. 998 من 1000 طلب ممكن ينجحوا واتنين يرجعوا errored. الكود بتاعك لازم يفحص result.result.type لكل response ويعيد إرسال الفاشل بشكل منفصل.

متى لا تستخدم Batch API

الأداة دي مش لكل سيناريو. اعتبرها ممنوعة في الحالات دي:

تطبيقات real-time زي شات بوت أو مساعد كود — المستخدم مش هيستنى ساعتين عشان يجاوب.
workloads أقل من 100 طلب — توفير $0.5 مش يستاهل تعقيد الـ async flow وكود الانتظار.
حالات بتحتاج شغل تكراري (agent loop): الرد الأول بيقرر شكل الطلب التاني، فما ينفعش تحطهم في نفس الـ batch.
أي use case بيعتمد على streaming لتحسين الـ perceived latency.
تجارب تطوير ودباجينج — انتظار 30 دقيقة لمشاهدة نتيجة prompt واحد بيقتل الإنتاجية.

الخطوة التالية

المصادر

Anthropic Message Batches API — التوثيق الرسمي على docs.anthropic.com/en/api/creating-message-batches — تفاصيل الـ endpoints والـ states والحدود.
Anthropic Pricing Page — على anthropic.com/pricing — تأكيد خصم الـ 50% على كل موديلات Claude.
Anthropic Engineering Blog — إعلان Batch API الأصلي وأرقام الـ throughput على المنصة.
Python SDK anthropic الإصدار 0.40+ — ملف messages/batches.py على المستودع الرسمي على GitHub.
OpenAI vs Anthropic Batch comparison — مراجعات من فرق هندسة على تجارب فعلية مع كلا الـ batch APIs.

Batch API في Claude للمتوسط: ادفع 50% أقل لمعالجة آلاف الأسئلة غير العاجلة

Batch API في Claude: ادفع 50% أقل لمعالجة آلاف الأسئلة غير العاجلة

المشكلة باختصار

إيه هو Batch API بمثال للمبتدئ

التعريف التقني الدقيق

كود Python شغّال على Anthropic SDK

أرقام مقاسة من ورك لود حقيقي

الـ trade-offs اللي لازم تعرفها

متى لا تستخدم Batch API

الخطوة التالية

المصادر

هل استفدت من المقال؟

Batch API في Claude للمتوسط: ادفع 50% أقل لمعالجة آلاف الأسئلة غير العاجلة

Batch API في Claude: ادفع 50% أقل لمعالجة آلاف الأسئلة غير العاجلة

المشكلة باختصار

إيه هو Batch API بمثال للمبتدئ

التعريف التقني الدقيق

كود Python شغّال على Anthropic SDK

أرقام مقاسة من ورك لود حقيقي

الـ trade-offs اللي لازم تعرفها

متى لا تستخدم Batch API

الخطوة التالية

المصادر

هل استفدت من المقال؟