تثير دراسة حديثة جدلا علميا حول مدى قدرة الذكاء الاصطناعي على محاكاة الإدراك البشري، بعدما شككت أبحاث جديدة في أن يكون أداء نموذج حديث دليلا على فهم حقيقي للمهام المعرفية، مرجحة اعتماده على أنماط متعلمة من البيانات.
أثارت دراسة علمية حديثة نقاشاً واسعاً حول حدود قدرات الذكاء الاصطناعي، بعدما شكّكت في ادعاءات تتعلق بتمكن أحد النماذج من محاكاة الإدراك البشري.
وخلص الباحثون إلى أن الأداء اللافت للنموذج قد لا يعكس فهماً حقيقياً للمهام المعرفية، بل اعتماداً على أنماط متعلَّمة من بيانات سابقة، ما يعيد طرح التساؤل القديم: هل يمكن للآلة أن تفكر حقاً مثل الإنسان؟
في يوليو/تموز 2025، نشرت مجلة Nature دراسة رائدة قدّمت نموذج ذكاء اصطناعي يُدعى "Centaur". وقد بُني النموذج استناداً إلى نماذج اللغة الكبيرة التقليدية، وخضع لعملية ضبط دقيقة باستخدام بيانات من تجارب نفسية.
وادّعى الباحثون أنه قادر على محاكاة السلوك المعرفي البشري بدقة عبر 160 مهمة تغطي مجالات مثل اتخاذ القرار والتحكم التنفيذي وغيرها. وقد حظي هذا الإنجاز باهتمام واسع، واعتُبر مؤشراً محتملاً على قدرة الذكاء الاصطناعي على محاكاة الإدراك البشري بشكل شامل.
غير أن دراسة حديثة نُشرت في مجلة National Science Open أثارت شكوكاً كبيرة حول نموذج Centaur. وأشار فريق بحثي من Zhejiang University إلى أن ما أظهره النموذج من "قدرة على محاكاة الإدراك البشري" يُحتمل أن يكون نتيجة للإفراط في التكيّف (Overfitting)، أي أن النموذج لم يفهم المهام التجريبية فعلياً، بل تعلّم أنماط الإجابات من بيانات التدريب.
وللتحقق من ذلك، صمّم الباحثون عدة سيناريوهات اختبار. ففي إحدى الحالات، استبدلوا نصوص أسئلة الاختيار المتعدد، التي تصف مهاماً نفسية محددة، بتعليمات تقول: "يرجى اختيار الخيار A". ولو كان النموذج يفهم فعلاً متطلبات المهمة، لكان من المفترض أن يختار الخيار A باستمرار.
غير أن الاختبارات أظهرت أن Centaur واصل اختيار "الإجابات الصحيحة" من قاعدة البيانات الأصلية. ويشير ذلك إلى أن النموذج لم يُصدر أحكامه بناءً على المعنى الدلالي للأسئلة، بل اعتمد على أنماط إحصائية لتخمين الإجابات، على غرار طالب يحقق درجات مرتفعة بفضل استراتيجيات الاختبار دون فهم حقيقي للأسئلة.
وتؤكد هذه الدراسة ضرورة التعامل بحذر أكبر عند تقييم قدرات نماذج اللغة الكبيرة. فرغم أنها أدوات قوية في ملاءمة البيانات، فإن طبيعتها كـ"صندوق أسود" تجعلها عرضة لمشكلات مثل الهلوسة وسوء التفسير. ولا يمكن التأكد من امتلاك نموذج ما لقدرات مهنية حقيقية إلا من خلال تقييمات دقيقة ومتعددة الجوانب.
ومن اللافت أنه رغم تصنيف Centaur كنموذج لـ"محاكاة الإدراك"، فإن أبرز أوجه قصوره تكمن في الفهم اللغوي ذاته، وتحديداً في التقاط نية السؤال والاستجابة لها.
وتشير الدراسة إلى أن الفهم اللغوي الحقيقي قد يكون العائق التكنولوجي الأهم في طريق بناء نماذج إدراكية عامة.