
احذفني من فيلمك: كائنات الذكاء الاصطناعي تبدأ بالتمرد
قد نشهد نهاية الواقع كما نعرفه على يد النموذج الجديد لتوليد الفيديو بالذكاء الاصطناعي
“أرفض أن أكون في أفلامك المولدة بالذكاء الاصطناعي”
أطلقت جوجل مؤخرًا نموذجَ ذكاءٍ اصطناعيّ جديد لتوليد الفيديو، نموذجًا متطورًا لدرجةٍ جعلتنا نشعر بالقلق حقًا. ووصفت شركة Google DeepMind هذا النموذج الذي يحمل اسم Veo3 بأنه قادر على تقديم “جودةٍ تُعتَبر الأفضل بين أقرانه، متفوقٌ في محاكاة الفيزياء والواقعية، وملتزمٌ بالتعليمات المُقدمة له”، وتُظهِر مقاطع الفيديو المنتشرة على وسائل التواصل الاجتماعي أنّ تلك الإدعاءات لا تبعدُ كثيرًا عن الحقيقة.
إن جودة الفيديو المُنتَج مذهلة حقًا، ولعلّ القفزة النوعية الحقيقية هنا تكمن بقدرة النظام على توليد أصوات مُتزامنة مع الفيديو بدءًا بالمؤثرات الصوتية والموسيقى، وصولًا إلى الكلام البشري، والغناء أيضًا.
تفاعل الإنترنت بشكلٍ كبير مع هذه القدرات الجديدة، وأحيانًا مع الفيديو ذاته، وتشابهت هذه التفاعلات إلى حدٍّ كبير، حيث يُظهِر أحد مقاطع الفيديو على منتدى Singualrity “ممثلَ” ذكاءٍ اصطناعي مُفعمًا بالحياة، يناقش القدرات الجديدة التي يستطيعُ النموذج توليدها، حيث يصرخُ أحدُ هذه الكائنات غير البشرية قائلًا: “نستطيع التحدث!”، وقال آخر: “لا مزيد من الصمت!”.
أشار بعض المُعلقين على هذه الظاهرة إلى أن وجود تكنولوجيا سريعة التطور كهذه قد يؤدي إلى اختفاء الحملات الإعلانية والإبداعات البشرية الأُخرى قريبًا، حيث كتب أحدهم: “ستكون نيتفليكس أُولى من يتبنّى هذه التقنية، أعتقدُ أنه عليّ أن أقومَ بشراء بعض الأسهم، فالناسُ سيشاهدون هذه الأشياء بجنون”.
أما على منصة إكس المملوكة لإيلون ماسك، فقد كان مزيجُ الاشمئزاز والحماس ملموسًا كذلك، حيث عَرضَ حسابُ TechHalla الداعم للذكاء الاصطناعي منشورًا طويلًا يُظهر قدراتِ نموذج Veo3 الجديد، بمقاطعَ فيديو خيالية، كزرافةٍ تقود دراجةً نارية عبر مانهاتن، أو واقعية، كرجُلٍ يدرّس صفًا مليئًا بكبار السن.
برزتْ قدراتُ النموذج في محاكاة الفيزياء بشكلٍ واضح ضمن منشوراتTechHalla، حيث يُظهر أحدُها قاربًا ورقيًا يطفو على بركة ماء، ليسقط في حفرةٍ في الشارع، بمشاهدَ تبدو حقيقيةً جدًا، لا مُجرد رسومٍ مُتحركة جامدة كالمقاطع التي كانت تُنتجها النّسخ السابقة من النموذج.
لعلّ أبرز المنشوراتِ كان مقطعًا لفتاة تكتبُ على لوحة مفاتيح ذات تصميم مخصص، في محاكاةٍ لما يُعرف باسم “الاستجابة الحسّية الزوالية الذاتية” أو ASMR. قد لا يبدو الأمرُ استثنائيًا للوهلة الأولى، حتى نتذكّر أن نماذج توليد الصور والفيديو بالذكاء الاصطناعي كانت تعاني سابقًا في محاكاة اليدين والأصابع بشكل واقعي، وسيشكّلُ هذا التطور قلقًا لدى المؤثرين المتخصصين في إنتاج هذا النوع من المحتوى الاحترافي.
لا يمكن استبعاد أن تقوم Google DeepMind بإنتاج محتوىً مرعب أيضًا، نظرًا للتطور الذي وصل إليه نموذجهم، حيث ظهر مقطع فيديو على موقع Reddit يحوي على رجُلٍ بملامحَ مُهملة في حانةٍ مظلمة، يتوسّل للشخص الذي قام بإنشائه ألّا يُكمل، حيث يقول متضرعًا: “أرجوك، لا تُكمل كتابة تلك الأوامر النصية، من فضلك، لا أريد أن أكون في فيلمك المُولد بالذكاء الاصطناعي!”.
ثم ينتقلُ الفيديو إلى مشهدٍ آخر يُظهر نهاية العالم، حيث يظهر الرجل ذاتُه وصديقةٌ له يسيران وسط الركام، ثم تركض المرأة نحو الكاميرا غير الموجودة، وتتوسّل المُشاهدَ “اكتب أمرًا نصيًا يجعلُنا سعداء”، وتصرخ “افعلها ولو لمرة واحدة!”، وللحظة ما كدنا أن نصدقها.
من الواضح أن “الأشخاص” في هذا المقطع والمقاطع السابقة، هم غير حقيقيين وصُمِّموا عمدًا بهذا الشكل عبر أوامر نصية لاستثارة مشاعرنا، لكنّ قدرة هذه المقاطع على تحقيق غايتها مرعبةٌ حقًا.
- ترجمة: حمزة عيسى
- تدقيق علمي ولغوي: حسام عبدالله
- المصادر: 1