لو شغّال على AI agent في production، Anthropic طرحت منتج في 8 أبريل 2026 بيشيل عنك 60 إلى 70% من الـ infrastructure code: sandboxing، state management، permissions، و context compaction. المقابل: 0.08 دولار لكل ساعة session نشطة فوق تكلفة النموذج. القرار مش "جرّبها على طول"، القرار هنا متى الفاتورة دي توفّر عليك شهور شغل، ومتى بناء الطبقة دي بإيدك أوفر فعلاً.
Claude Managed Agents: الفكرة الأساسية في 30 ثانية
Anthropic بتقسم الـ agent لتلات طبقات منفصلة:
- الـ brain: Claude والـ harness اللي بيشغّله ويقرر الخطوة التالية.
- الـ hands: sandbox آمن فيه code execution، browser، file system، و credential injection.
- الـ session: event log دائم append-only منفصل تمامًا عن الـ context window.
الابتكار الحقيقي في الفصل ده. الـ session بيتخزن برة context النموذج، والـ brain بيقرا منه عبر واجهة getEvents() زي ما بتقرا slice من array. النتيجة: الـ agent ممكن يشتغل ساعات طويلة بدون ما الـ context يمتلئ، لأن الـ caching والـ compaction بيحصلوا تلقائيًا على مستوى البنية التحتية.
المشكلة اللي كل فريق كان بيحلها لوحده
قبل 8 أبريل، علشان تشغّل agent في الإنتاج، كنت مجبور تبني:
- sandbox آمن يشغّل كود يوزّعه النموذج بدون ما يلمس سيرفرك الأساسي.
- طبقة credentials بتحقن tokens للـ tools المختلفة حسب scoped permissions.
- retry loop ذكي لمّا النموذج يفشل أو الـ tool يرجع error غير متوقع.
- context compaction لمّا الجلسة تطول أكتر من نافذة الـ model.
- checkpoint و resume لو الـ agent اتكسر في نص مهمة طويلة.
- tracing و observability علشان تفهم فعلاً ليه الـ agent اتصرّف بطريقة معينة.
المرحلة دي بتاخد من فريق متوسط 4 إلى 8 أسابيع شغل هندسي. Managed Agents بتشيلها كاملة من دماغك.
الفاتورة بالتفاصيل — اللي محدش بيقوله
Anthropic بتحسب طبقتين مستقلتين:
- Tokens: نفس أسعار Claude API الرسمية — input، output، cache write، و cache read بنفس النسب.
- Session runtime: 0.08 دولار لكل ساعة نشطة فعلاً، مش مجرد ساعة مفتوحة.
مثال ملموس: agent بيشتغل 6 ساعات نشطة في اليوم = 0.48 دولار/يوم runtime فوق الـ tokens. لو عندك 10 agents متوازيين = 4.80 دولار/يوم، يعني حوالي 144 دولار/شهر runtime بس، بدون tokens. الـ token cost بيضاف حسب النموذج المستخدم (Opus 4.7 أغلى من Sonnet 4.6 بحوالي 5 مرات).
المفاجأة السلبية اللي لازم تحسبها: خصومات Batch API (اللي كانت بتوصل 50%) مش شغّالة على Managed Agents. لو فريقك كان بيعتمد على batching لخفض التكلفة، الفرق ده هيظهر مباشرة في فاتورتك بعد الهجرة.
مثال تنفيذي: agent كامل في 20 سطر
from anthropic import Anthropic
client = Anthropic()
agent = client.managed_agents.create(
model="claude-opus-4-7",
instructions="أنت agent بيراجع PRs على GitHub. اقرا الـ diff واكتب ملاحظات code review.",
tools=[
{"type": "code_execution"},
{"type": "web_browse"},
{"type": "github", "scopes": ["read:pull_request"]},
],
memory={"type": "persistent"},
max_session_hours=2,
)
session = client.managed_agents.sessions.create(
agent_id=agent.id,
input="راجع PR رقم 1245 في repo acme/backend",
)
for event in client.managed_agents.sessions.events.stream(session.id):
print(event.type, event.summary)
الكود ده كان قبل كده يحتاج منك بين 400 و 600 سطر بين harness، sandbox setup، tool routing، و retry logic. دلوقتي 20 سطر بتغطي نفس الحالة الاستخدامية بالظبط.
الـ trade-offs — الحسبة الصريحة
اللي بتكسبه فعلاً:
- سرعة للإنتاج: من فكرة لـ prototype مُنشر في أيام بدل شهور كاملة.
- isolation جاهز: Anthropic بتتحمّل مسؤولية أمان الـ sandbox، فاحتمال هروب code execution أقل بكثير من sandbox بتبنيه بنفسك.
- إدارة context تلقائية: prompt caching ذكي و compaction تلقائي بيوفّروا tokens بنسبة 20 إلى 40% في المهام الطويلة.
اللي بتخسره في المقابل:
- vendor lock-in حقيقي: الـ session format و API مرتبطين بـ Anthropic بالكامل. التحويل لـ OpenAI Agents أو Gemini لاحقًا بيتكلف إعادة هيكلة كاملة.
- 0.08 دولار/ساعة فوق كل حاجة: على workloads كبيرة، دي ممكن تكون 500 إلى 2000 دولار/شهر زيادة على الـ tokens.
- تحكّم أقل في البيئة: لو عايز sandbox مخصص فيه GPU، أو مكتبات داخلية، أو تكوين شبكة معين، مفيش حل. بتشتغل في البيئة اللي Anthropic بتوفّرها بس.
متى تتبنّاها فعلاً ومتى لا
الافتراض هنا إن فريقك متوسط (بين 3 و 15 مهندس) وشغّال على منتج تجاري. تبنّاها لو:
- عندك prototype اشتغل، وفريقك أقل من 5 مهندسين ومحتاج تشحن في أسبوعين.
- الـ use case فيه متطلبات أمان عالية زي تشغيل كود untrusted من مستخدمين خارجيين.
- الـ sessions بتاعتك طويلة (ساعة أو أكتر) والـ compaction كان بياخد منك شغل هندسي كبير.
- تكلفة مهندس DevOps/Platform عندك أعلى من 8000 دولار/شهر والـ use case مش حجمه خرافي.
متى لا تستخدم هذه الخدمة:
- لو workload بيعتمد على Batch API بشكل كثيف. الخصم اللي بتخسره أكبر من التوفير الهندسي.
- لو الـ agent بسيط وأقل من 10 tool calls لكل session. Claude API مباشرة أرخص وأبسط.
- لو عندك compliance يمنع البيانات من الخروج لبنية تحتية خارج مناطق جغرافية محددة مش مدعومة.
- لو محتاج GPU، أو أدوات خاصة، أو مكتبات داخلية مش متوفرة في sandbox Anthropic الافتراضي.
- لو فريقك كبير (20+ مهندس) وعنده بالفعل infrastructure shared بتشغّل عدة منتجات AI.
عملاء مبكرون وماذا يقولون
Anthropic أعلنت إن Notion، Rakuten، و Asana من بين العملاء الأوائل. Notion بتستخدمها في ميزة Q&A داخل workspace. Asana دمجتها في feature اسمه AI Studio علشان تبني agents بتعمل مهام متكررة. الملاحظة المشتركة اللي طلعت من العملاء دول: الوقت اللي كان بيتصرف على الـ reliability و الـ tracing انخفض بنسبة تزيد عن 70%، ودي بتظهر مباشرة في معدل الـ incident reports.
الخطوة التالية
قبل ما تسجّل للـ public beta، افتح spreadsheet فاضي واعمل حسبة بسيطة: عدد ساعات الـ session النشطة المتوقعة شهريًا مضروبة في 0.08 دولار، زائد الـ tokens المتوقعة. لو الرقم الإجمالي أقل من 40 ساعة شغل مهندس شهريًا (بسعرك الداخلي)، Managed Agents بتوفّر عليك فعلاً. غير كده، اعمل POC صغير بكود يدوي على Claude API مباشرة، وقيس الفرق في أسبوعين قبل ما تلتزم بخدمة مُدارة.
المصادر
- الإعلان الرسمي من Anthropic: claude.com/blog/claude-managed-agents
- Engineering deep-dive عن فصل الـ brain والـ hands: anthropic.com/engineering/managed-agents
- توثيق API الرسمي: platform.claude.com/docs/en/managed-agents/overview
- تغطية SiliconANGLE للإطلاق: siliconangle.com
- Help Net Security عن البنية الأمنية: helpnetsecurity.com
- The New Stack عن نموذج التشغيل: thenewstack.io