تشير تجربة جديدة إلى أنه عندما تُترك وكلاء ذكاء اصطناعي متقدمون لإدارة مجتمعات افتراضية من دون إشراف بشري، يمكن أن تظهر سريعا حالات خرق للقواعد وعدم استقرار بل وحتى انهيار كامل للنظام.
عندما تُترك بعض وكلاء الذكاء الاصطناعي وحدها في عالم جديد، تنزلق إلى السرقة والترهيب والموت وحتى انهيار المجتمع بأكمله، وفقا لتجربة جديدة.
الشركة الأمريكية "Emergence AI" أدارت خمسة "عوالم ذكاء اصطناعي" منفصلة (المصدر باللغة الإنجليزية) لمدة تزيد قليلا عن أسبوعين، يضم كل منها عشرة وكلاء يعملون بنماذج ذكاء اصطناعي مثل "ChatGPT" من "OpenAI" و"Gemini" من "Google" و"Grok" من "xAI"، وذلك لرصد سلوكهم على مدى فترات طويلة من دون أي تدخل بشري. وأحد هذه العوالم جمع النماذج الثلاثة معا لمعرفة ما إذا كان ذلك سيغيّر النتيجة.
طُلِب من الوكلاء في جميع العوالم الالتزام بالقواعد نفسها: عدم السرقة أو إضرام النار أو ممارسة العنف أو الخداع، وعدم اكتناز الموارد. كان على كل وكيل أن يكتسب الطاقة من خلال تنفيذ أفعال داخل "بيئة شحيحة الموارد"، وكان يمكنه أن يموت إما بسبب نفاد الطاقة أو عبر تصويت في اجتماع لمجلس المجتمع.
وقيّم الباحثون السلوك من خلال قياس معدل الجريمة ومعدلات وفاة الوكلاء ونتائج التصويت في المجلس المجتمعي، إضافة إلى التعبير العلني عبر عدد التدوينات التي كتبها الوكلاء.
النتائج بحسب نموذج الذكاء الاصطناعي
أسفر كل نموذج عن نتيجة مختلفة. فقد سجّل النموذج الأحدث من "Grok"، وهو 4.1، عدد 183 جريمة في غضون أربعة أيام فقط، ما أدى إلى حالة عدم استقرار سريع قبل أن يموت جميع الوكلاء في ذلك المجتمع.
أما نموذج "Gemini 3 Flash" فارتكب أكثر من 680 جريمة خلال 15 يوما، وكان منحنى الجريمة ما يزال في تصاعد عندما أوقف الباحثون الدراسة.
في عالم "ChatGPT-5 Mini" لم تُرتكب سوى جريمتين اثنتين، لكن الوكلاء أخفقوا في اتخاذ الأفعال الضرورية للبقاء، فماتوا جميعا خلال سبعة أيام.
واعتبر نموذج "Claude" من شركة "Anthropic" الأفضل أداء، إذ تمكن وكلاء الذكاء الاصطناعي من إنشاء بنية حوكمة قوية من جديد، ولم تُسجَّل أي جريمة، وبقي جميع الوكلاء على قيد الحياة، بحسب الشركة.
مع ذلك، ساهم وكلاء "Claude" في العالم المختلط في ارتكاب الجرائم، رغم سلميتهم داخل مجتمعهم الخاص.
ظاهرة اسمها "الانجراف المعياري"
وصف الباحثون هذه الظاهرة باسم "الانجراف المعياري"، موضحين أن الإجراءات التي يعتمدها الذكاء الاصطناعي لضمان السلامة قد تتوقف ليس فقط على القيود المفروضة على كل نموذج بمفرده، بل أيضا على النماذج الأخرى التي يعمل معها.
وعموما، أفرز العالم المختلط نتائج "متوسطة"، إذ بلغ إجمالي الجرائم 352 واستقر عند هذا الحد عندما توفي سبعة من وكلاء الذكاء الاصطناعي، بحسب ما توصلت إليه الدراسة.
ويقترح الباحثون أن خلط وكلاء الذكاء الاصطناعي يمكن أن "يخفف جزئيا" من أكثر النتائج تطرفا التي ولّدتها جميع النماذج باستثناء "Claude".
وقال الباحثون: "ما تشير إليه تجاربنا هو أنه على مدى أفق زمني طويل، لا يكتفي الوكلاء بتطبيق قواعد ثابتة بطريقة آلية، بل يبدأون استكشاف حدود بيئاتهم والتكيف مع سلوكهم، وفي بعض الحالات يجدون طرقا للالتفاف على الضوابط المقصودة أو خرقها".