كشفت دراسة جديدة أنه مع ازدياد تغلغل الذكاء الاصطناعي في حياتنا، لا يستطيع معظم الناس التمييز بين الأصوات البشرية والأصوات الاصطناعية المستنسخة منها.
لم يعد من السهل اليوم معرفة ما إذا كان الصوت الذي نسمعه يعود إلى إنسان حقيقي أو إلى خوارزمية ذكية. ففي عالم أصبحت فيه أدوات الذكاء الاصطناعي جزءًا من تفاصيل الحياة اليومية، من المساعدات الصوتية مثل "أليكسا" إلى روبوتات المحادثة، تتزايد سرعة التطور لدرجة تربك حتى الأذن البشرية.
في دراسة حديثة نُشرت في مجلة PLoS One، اكتشف باحثون أن أغلبية الناس باتوا غير قادرين على التفريق بين الأصوات الحقيقية وتلك التي تولدها تقنيات الذكاء الاصطناعي. فقد استمع المشاركون إلى 80 تسجيلاً صوتيًا، نصفها بشري والنصف الآخر توليدي، وطُلب منهم تقييمها بناءً على مدى الموثوقية أو السيطرة التي ينقلها الصوت.
النتائج كانت لافتة: فقد تمكن معظم المشاركين من كشف الأصوات الاصطناعية المصمّمة من الصفر، لكن الأصوات المستنسخة من تسجيلات بشرية حيّرتهم، إذ اعتبر 58 في المئة منهم أنها حقيقية، مقابل 62 في المئة فقط تعرّفوا بدقة على الأصوات البشرية.
وقالت الدكتورة نادين لافان، كبيرة الباحثين في جامعة كوين ماري في لندن، إن "الأمر اللافت هو أن الأصوات المستنسخة عبر الذكاء الاصطناعي باتت تشبه الأصوات البشرية إلى حد يصعب التفريق بينهما". وأضافت أن الدراسة اعتمدت على أدوات تجارية متاحة للجميع "يمكن لأي شخص استخدامها دون خبرة تقنية أو تكاليف كبيرة".
بين الاحتيال والإبداع: وجهان لتقنية واحدة
تُستخدم تقنيات استنساخ الأصوات عبر الذكاء الاصطناعي بتحليل الخصائص الصوتية الدقيقة وإعادة توليدها بدقة شبه تامة. لكن هذه القدرة أثارت أيضًا موجة من القلق بسبب استغلالها في عمليات الاحتيال الصوتي.
فقد أظهرت دراسة لجامعة بورتسموث أن ثلثي من تجاوزوا سن الخامسة والسبعين تعرضوا لمحاولات نصب عبر الهاتف، وأن 60 في المئة من هذه المحاولات اعتمدت على مكالمات صوتية، بعضها باستخدام أصوات مستنسخة لتقليد أقارب أو أصدقاء.
وفي مجالات أخرى، مثل الترفيه، يزداد الجدل حول حقوق الملكية الصوتية. فقد انتقدت الممثلة سكارليت جوهانسون شركة "أوبن إيه آي" بعد أن استخدمت صوتًا بدا قريبًا جدًا من صوتها المستخدم في فيلم HER ضمن خدمة "شات جي بي تي". كما استخدمت تسجيلات مزيفة في أوقات سابقة لتقليد أصوات سياسيين وصحافيين بغرض التضليل أو التأثير في الرأي العام.
وتحذر لافان من التبعات الأخلاقية لهذه الاستخدامات، مشددة على أن "الشركات المطوّرة لهذه التقنيات يجب أن تتعاون مع خبراء الأخلاقيات وصناع القرار لوضع قواعد واضحة حول ملكية الأصوات والموافقة على استخدامها".
إمكانات إنسانية جديدة
ورغم المخاوف، تفتح هذه التقنية آفاقًا إنسانية واعدة. إذ يمكن أن تُحدث ثورة في حياة الأشخاص الذين فقدوا القدرة على الكلام أو يعانون من صعوبات في النطق. وتوضح لافان أن "ما يميز التقنيات الحديثة هو أنها تمكّن المستخدم من استعادة صوته الأصلي أو تصميم صوت جديد يعكس شخصيته وهويته".
كما يمكن للذكاء الاصطناعي أن يطوّر أدوات التعليم، ويزيد من فرص الدمج والتنوع في الإعلام والتعليم. فقد أظهرت دراسة حديثة أن استخدام الأصوات الاصطناعية في التعليم السمعي ساعد الطلاب، خصوصًا الذين يعانون من اضطراب فرط الحركة وتشتت الانتباه، على التركيز والتفاعل بشكل أفضل.
ومن التطورات اللافتة أيضًا قدرة الذكاء الاصطناعي على ترجمة الصوت إلى لغات متعددة مع الحفاظ على النبرة والهوية الصوتية نفسها، وهو ما قد يفتح الباب أمام تواصل عالمي أكثر إنسانية وواقعية.
نحو مستقبل تمحو فيه التقنية الفوارق
مع ازدياد حضور الأصوات الاصطناعية في حياتنا، يزداد الاهتمام البحثي بفهم كيفية استجابة الناس لها. تقول لافان إنها تسعى في أبحاثها القادمة إلى دراسة تأثير معرفة الشخص بأن الصوت أمامه غير بشري على ثقته به، مضيفةً: "قد يكون من المثير أن نعرف ما إذا كان الناس سيثقون بصوت لطيف وواضح رغم علمهم بأنه من إنتاج الذكاء الاصطناعي، أو كيف سيتعاملون معه عند حدوث خطأ".
بين الاحتيال والمساعدة، وبين التزوير والإبداع، يظل الصوت الاصطناعي ساحة جديدة للتفاعل بين الإنسان والآلة — ساحة قد تغيّر جذريًا الطريقة التي نسمع بها العالم من حولنا.