الحد الأدنى من الصلاحيات
لا تصل الوكلاء والمحركات إلا إلى البيانات والأدوات التي تتطلّبها المهمة. تُحدَّد الأذونات لكل طلب وتنتهي بانتهاء المهمة، فلا تستطيع خطوة واحدة مخترَقة بلوغ النظام الأوسع.
تحتاج الأنظمة المستقلة إلى أكثر من أمان المحيط. إنها تحتاج إلى سياسات وقابلية للتتبع والتحقق واحتواء الأعطال.
لا تصل الوكلاء والمحركات إلا إلى البيانات والأدوات التي تتطلّبها المهمة. تُحدَّد الأذونات لكل طلب وتنتهي بانتهاء المهمة، فلا تستطيع خطوة واحدة مخترَقة بلوغ النظام الأوسع.
تُنتج الإجراءات المهمة سجلات قابلة للفحص وإعادة التشغيل للاستدلال والتنفيذ. يمكن إعادة بناء كل قرار خطوة بخطوة، فيتحوّل تصحيح الأخطاء والتدقيق إلى قراءة تاريخ لا تخمين.
تُقيَّد الإجراءات المحفوفة بالمخاطر بسياسات وعتبات وموافقات ومسارات تراجع قبل تنفيذها. تُفرَض الحدود وقت التنفيذ لا كإرشاد، فتُحجَب الإجراءات غير الآمنة لا أن تُسجَّل فحسب.
تُدخل أنظمة الذكاء الاصطناعي أنماط أعطال جديدة: حقن الأوامر، وإساءة استخدام الأدوات، والكشف غير المقصود عن البيانات، والإجراءات المُهلوَسة، والسياق القديم، والاستقلالية غير المحدودة.
مدخلات غير موثوقة تحاول التلاعب بسلوك النموذج أو الوصول إلى الأدوات.
يمكن لوكيل يتمتع بصلاحيات مفرطة أن يحوّل خطأً صغيرًا في الاستدلال إلى إجراء له أثر في العالم الحقيقي.
يجب إخضاع النماذج والأدوات والحزم والموصِّلات للإصدارات والتدقيق والمراقبة.
البنية التحتية المستقلة الجيدة تجعل الإجراءات المسموح بها صريحة والإجراءات غير الآمنة صعبة.