الوكيل عمل في العرض التوضيحي. أجاب على الأسئلة واستدعى الأدوات وأنتج مخرجات منظمة. بعد أسبوعين من الإنتاج: راكم السياق حتى تدهورت الاستجابات، واستدعى الأدوات دون التحقق من المدخلات، وفقد الحالة بين عمليات التشغيل، ولم يكن لديه آلية للتصعيد حين واجه شيئاً خارج تدريبه. حدد تقرير ما بعد الوفاة السبب الجذري بأنه “قيود النموذج اللغوي”. السبب الجذري الفعلي: الفريق بنى الوكيل بمنح نموذج وصولاً إلى أدوات وسمّى ذلك نظاماً.
لم يكن نظاماً. كان نموذجاً لغوياً بمفاتيح API.
خطأ الفئة الذي يُسبّب إخفاقات الوكلاء
حين تبني فرقة مؤسسية وكيلاً بربط نموذج بأدوات وتوجيهه لمعرفة الباقي، تكون قد فوّضت تصميم النظام للنموذج. سيُقرّر النموذج ما يحتفظ به من سياق، ومتى يستدعي أي أداة، وما يُشكّل النجاح، وما إذا كان يتوقف. سيتخذ تلك القرارات بشكل غير متسق، لأن تلك القرارات تتطلب قواعد حتمية، لا نمذجة لغوية.
يُسمّي إطار 12-Factor Agents، الذي طوّره Dex Horthy في HumanLayer، هذا خطأ الفئة: التعامل مع النموذج اللغوي كنظام بدلاً من كمكوّن واحد في نظام. إعادة الإطار: النموذج يولّد رموزاً (tokens) ولا شيء آخر. الكود الحتمي يُنفّذ الأدوات ويتحقق من الحالة ويدير السياق ويُثبّت النتائج ويُقرّر متى يتوقف أو يُصعّد.
تغيير إعادة الإطار هذا يُغيّر ما تبنيه. يُغيّر أيضاً طريقة تصحيح الأخطاء. حين يفشل وكيل، السؤال لم يعد “ما الذي أخطأ فيه النموذج؟” بل “أي مكوّن فشل، وأي اختبار برمجي كان سيلتقط ذلك؟“
المبدأ الأساسي: امتلك الحلقة
كل وكيل حلقة: لاحظ وفكّر وتصرّف. اللاحظة تعني قراءة السياق، بما فيه الحالة الحالية ونتائج الأدوات السابقة والذاكرة ذات الصلة وأي شيء آخر يحتاجه النموذج للاستدلال. التفكير يعني التخطيط للإجراء التالي بالنظر إلى الهدف والحالة المُلاحظة. التصرف يعني تنفيذ الإجراء، سواء كان استدعاء أداة أو كتابة ملف أو طلب API أو مخرجاً.
امتلاك الحلقة يعني جعل كل جزء من تلك الدورة صريحاً ومتحكماً به بواسطة البرمجيات، لا ضمنياً ومفوَّضاً للنموذج.
امتلك ما يدخل نافذة اللاحظة. النموذج يستدل على ما هو في نافذة السياق. يجب أن يُجمَّع محتوى نافذة السياق بواسطة كود حتمي يُحمّل بالضبط ما تتطلبه هذه الخطوة. لا “ها هو كل شيء، أيها النموذج، اكتشف ما يهم”. سحر الإطار الذي يُحقن الذاكرة وتاريخ المحادثة ونتائج الأدوات ضمنياً يُنتج نوافذ سياق غير قابلة للتنبؤ في الإنتاج ومستحيلة التصحيح حين يتدهور النموذج.
امتلك بنية خطوة التفكير. التفكير عبر سلسلة، والاستدلال اللوحي، ومخططات المخرجات المنظمة، والتحقق من المخرجات كلها آليات لجعل خطوة التفكير تُنتج مخرجات قابلة للفحص والاختبار. نموذج يكتب نصاً غير منظم قبل اتخاذ إجراء أصعب في التحقق منه من نموذج يُنتج كائن قرار منظم.
امتلك القيود على الإجراء. يجب أن يسبق كل استدعاء أداة التحقق من المخطط. يجب أن يسبق كل إجراء له عواقب تصنيف قابلية العكس. يجب أن تتطلب بعض الإجراءات موافقة بشرية قبل التنفيذ. هذه مكوّنات برمجية، لا سلوكيات نموذج.
للمؤسسات: امتلاك الحلقة يعني أيضاً امتلاك مسار التدقيق. أي نافذة سياق أنتجت أي قرار في أي خطوة في أي تشغيل. هذا متطلب امتثال في القطاعات المنظمة، لا ميزة تسجيل.
العوامل الأكثر فائدة للإنتاج
الإطار الكامل ذو 12 عاملاً متاح في المواد المصدرية. العوامل التي تمنع بشكل مباشر أنماط الفشل الملاحظة في عمليات النشر المؤسسية:
امتلك الموجّهات رمزاً برمز. اعرف بالضبط ما في نافذة السياق في كل خطوة. لا حقن ضمني. إذا كان الإطار يُضيف ذاكرة وتاريخاً ونتائج أدوات إلى السياق دون تعليمات صريحة، فهذا خطر إنتاجي. “الإطار يتعامل مع إدارة السياق” جملة ينبغي أن تُثير قلقاً لا اطمئناناً.
جمّع السياق صراحةً. حمّل فقط ما هو ضروري لهذه الخطوة. خطوة بحث تحتاج نتائج بحث الويب وتصريح هدف. لا تحتاج التاريخ الكامل للمحادثة وملف المستخدم ومحتويات ثلاثة وثائق أخرى. انتفاخ السياق يُدهور الجودة ويرفع التكلفة. نافذة السياق مورد لا ورقة خردة لكل ما قد يكون ذا صلة.
تعامل مع الأدوات كمخططات مكتوبة بوضوح مع كود حتمي. عرّف مخططات المدخلات والمخرجات لكل أداة. تحقق من المدخلات قبل التنفيذ. اختبر الأدوات باستقلالية عن حلقة الوكيل. أداة تكتب إلى قاعدة بيانات يجب أن تكون قابلة للاختبار دون تشغيل الوكيل بالكامل. إذا لم تكن الأداة قابلة للاختبار باستقلالية، فليست أداة. إنها كود غير متمايز بـ API.
افصل حالة التنفيذ عن حالة الأعمال. تقدم الوكيل عبر الخطوات (في أي خطوة، وأي أدوات استدعى، وأي مخرجات أنتج) هي حالة التنفيذ. كائن الأعمال الذي يُعدَّل (أمر شراء أو سجل عميل أو نتيجة امتثال) هو حالة الأعمال. هذان يعيشان في أماكن مختلفة. خلطهما يجعل استرداد الحالة بعد الفشل معقداً وعرضة للأخطاء.
ابقِ الوكلاء صغاراً. ثلاثة إلى عشرة خطوات بشروط دخول واضحة وشروط خروج واضحة. الوكلاء بأكثر من 30 خطوة وحلقات مفتوحة كوابيس في التصحيح. حين يتطلب المهمة أكثر من عشر خطوات، فهي في معظم الأحيان قابلة للتحليل إلى وكيلين أو ثلاثة أصغر مع بروتوكول تسليم.
لخّص الأخطاء قبل إعادة الحقن. حين يفشل استدعاء أداة، تتعقيد الاستثناء الخام يستهلك رموزاً ويُربك النماذج كثيراً. اضغط الخطأ: “فشلت الأداة X بسبب Y؛ المحاولات الثلاث الأخيرة أنتجت Z”. أعط النموذج معلومات منظمة عن الفشل، لا جداراً من تتبع المكدس.
الموافقة البشرية كمكوّن نظام. بالنسبة للإجراءات عالية المخاطر أو غير القابلة للعكس، الموافقة البشرية ليست مساراً استثنائياً يُضاف حين يسوء شيء. إنها خطوة مصمَّمة في سير العمل بواجهة موافقة محددة وسياسة تحمّل مُحددة ومسار تصعيد مُحدد. ابنِها قبل الحاجة إليها.
MCP كبنية تحتية محكومة للأدوات
بروتوكول سياق النموذج (MCP) هو المعيار لكشف الأدوات للوكلاء كموصّلات محكومة ومُصدَّرة ذات أثر تدقيق مبني في طبقة البروتوكول.
اعتباراً من ديسمبر 2025، تبرّعت Anthropic بـ MCP لمؤسسة Agentic AI بموجب مظلة مؤسسة Linux، وهي الآن مُدارة مشتركاً من Anthropic وOpenAI وGoogle وMicrosoft وAWS. أكثر من 10,000 خادم MCP نشط، مع 97 مليون تنزيل شهري لـ SDK. أصبح MCP المعيار الفعلي لاتصال أدوات الوكلاء، لا حلاً خاصاً بمورّد.
للمؤسسات: يحوّل MCP كل أداة إلى واجهة محكومة بنطاق محدد ومصادقة وتقييد معدل وسجل تدقيق لكل استدعاء. بدلاً من إجراء كل وكيل مكالمات API مباشرة بإدارة المصادقة الخاصة به ومعالجة الأخطاء الخاصة به، يوفر MCP طبقة بنية تحتية مشتركة. تُدار الأذونات على طبقة MCP لا تُكرَّر لكل وكيل.
المخاطرة التي تستحق التسمية مباشرةً: MCP بدون حوكمة هو سطح هجوم واضح التسمية. كل خادم MCP يتصل بأنظمة الإنتاج يحتاج إلى قائمة بيضاء صريحة ومصادقة وتسجيل تدقيق على مستوى البوابة. اكتشاف فئة ثغرة RCE في تصميم بروتوكول MCP في أبريل 2026 أكد أن خوادم MCP، كأي مكوّن برمجي، تتطلب مراجعة أمنية وتصحيحاً. وجود معيار لا يُعوّض ممارسات الأمن.
LangGraph لتنسيق الوكلاء المؤسسيين
للوكلاء الذين يتطلبون إدارة الحالة والتفريع وخطوات إنسان في الحلقة والتنفيذ المتوازي، يوفر LangGraph رسم بياني حالة صريح حيث كل انتقال حالة مرئي وقابل للتوقف والاستئناف.
التمييز المعماري المهم للمؤسسات: LangGraph ذو حالة. حالة تنفيذ الوكيل تستمر بين الخطوات. إذا توقف الوكيل لموافقة بشرية، تُحفظ الحالة. إذا فشل الوكيل في منتصف التنفيذ، يمكن فحص الحالة واستئنافها. هذا ليس سلوكاً افتراضياً لمعظم أطر الوكلاء.
يشمل التبني في الإنتاج عمليات نشر في Cisco وUber وLinkedIn وJPMorgan اعتباراً من 2026. المنصة ليست تجريبية.
LangSmith، منصة المراقبة المرتبطة، يتتبع كل خطوة في تنفيذ الوكيل: ما كان في نافذة السياق، وأي أدوات استُدعيت، وما الذي أرجعته، وكم استغرقت كل خطوة. لعمليات النشر المؤسسية حيث شرح سلوك الوكيل لفريق الامتثال متطلب، LangSmith يوفر الأثر. Langfuse هو البديل المستضاف ذاتياً للبيئات الحساسة لموقع البيانات.
متى لا تستخدم وكيلاً
معظم المهام المقترحة كسير عمل للوكلاء تُخدَم بشكل أفضل بأتمتة حتمية أو مكالمة نموذج لغوي واحدة.
الوكيل مناسب حين: تتطلب المهمة استدعاءات أدوات متباينة متعددة حيث التسلسل غير ثابت مسبقاً، والنتائج الوسيطة تُعلم أي الأدوات تستدعي بعد ذلك، وفضاء المسارات المحتملة عبر المهمة غير قابل للتعداد قبل التنفيذ.
الوكيل خاطئ حين: تتبع المهمة إجراءً ثابتاً، وتُستدعى الأدوات دائماً بنفس الترتيب، وكل تنفيذ يسلك نفس المسار. تلك أتمتة سير عمل. Zapier أو n8n أو Trigger.dev تتعامل معها بشكل أرخص وأكثر موثوقية من وكيل. النموذج يُضيف تكلفة وعدم حتمية دون إضافة ذكاء.
السؤال التشخيصي من إطار 12-Factor المطبَّق كبوابة قبل البناء: هل تتطلب هذه المهمة فهم اللغة عند نقاط القرار، تحديداً لاتخاذ قرار بشأن الإجراء التالي؟ أم تتطلب فقط أتمتة تسلسل ثابت؟
إذا كانت الإجابة الصادقة هي الأتمتة، ابنِ الأتمتة. إطار الوكيل سيجعلها أكثر تعقيداً في التصحيح وأغلى في التشغيل وأصعب في الشرح حين يسوء شيء.
البنيات متعددة الوكلاء تطبّق نفس المنطق درجة أعلى: المزيد من الوكلاء ليس ذكاءً أكثر. القرار هو ما إذا كانت بنية المهمة تتطلب ذلك فعلاً.
للفرق المؤسسية التي تُقيّم أين تخلق الوكلاء قيمة حقيقية مقابل حيث تُضيف تعقيداً دون عائد، رحلة فرصة AI ترسم خريطة القرار.