شركة Stability تنتج أجسادًا بشرية مشوهة

تجربة بدائية

أصدرت شركة Stability AI الناشئة في مجال الذكاء الاصطناعي نموذج الذكاء الاصطناعي لتحويل النص إلى صورة باسم Stable Diffusion 3 Medium، بعد بضعة أشهر من الفوضى. إن الذكاء الاصطناعي الجديد هو نموذج لتوليد الصور المتطورة جدًا حتى الآن وفقًا لشركة Stability. فلماذا إذن يولد باستمرار وحوشًا مرعبة غريبة؟

لجأ مستخدمو Stable Diffusion المحبطون من تجاربهم كما ذكر موقع Ars Technica، إلى موقع الأخبار الشعبي Reddit (موقع أمريكي يتشارك فيه المستخدمون آخر الأخبار ونتائج تجاربهم للمنتجات) للشكوى من فشل النموذج الجديد في إنشاء صورة لإنسان طبيعي بدون تشوهات مرعبة في الأطراف التي تُصور غير متماسكة بواسطة الذكاء الاصطناعي.

كتب أحد مستخدمي Reddit المنزعجين من الأشكال المشوهة المولدة على الموقع: «لم أتمكن من إنشاء صورة واحدة لائقة على الإطلاق، جميعها بعيدة عن المتطلبات المذكورة في الأمثلة. لقد حاولت وصف متطلبات دقيقة دون جدوى. حتى أنني طلبت أشكال أساسية تمامًا مثل (صورة لشخص نائم في غرفة المعيشة) فتكون النتيجة وحوشًا تشبه تلك التي ابتكرها المخرج كرونينبيرج في أفلامه المرعبة».

وأضاف مستخدم آخر محبط: «سيكون الأمر مضحكًا إن لم يكن مزعجًا للغاية».

أبلغ عدد قليل من المستخدمين حول نفس الموضوع أنهم تمكنوا من إنشاء بشر بمظهر طبيعي، لكن يبدو أن هؤلاء الأشخاص يشكلون أقلية صغيرة. هل تريد صورة لشخص منشئة بواسطة الذكاء الاصطناعي؟ إذا كنت تستخدم Stable Diffusion 3، فاحذر من أن يولد لك حساء عوضًا عن ذلك.

خلاصة أفلام كرونينبيرج المرعبة والتي يبلغ عددها 22

استنادًا إلى الأدلة التي شاركها مستخدمو Reddit، فإن إطلاق تعبير (سلسلة أفلام كرونينبيرج) هو توصيف دقيق للصور.

ولّدت عبارة بسيطة مثل (امرأة مستلقية على الشاطئ) تشوهًا في الوجه والذراعين والشعر ودمجها مع جذع للشجرة، في حين شارك عدد من المستخدمين صورًا لنساء بأيديهن المشوهة. كما ناقش المستخدمون في مكان آخر ضمن الموقع تجربته في محاولة إنشاء صور لنساء مستلقيات على العشب فكانت النتيجة صورًا كابوسية لكائنات تشبه الإبهام.

يواجه الذكاء الاصطناعي صعوبة في الغالب مع الأشكال البشرية. لكن التجارب الأخرى تنتج مخرجات أخرى تبدو جيدة تمامًا كما ذكر مستخدمو Reddit، وهي النتيجة التي من المحتمل أن تكون بسبب قرار شركة Stability بتدريب النموذج على مجموعة بيانات تستبعد الصور غير المناسبة للعمل (التي تبدو إباحية أو صور النساء).

هنا يطرح سؤال نفسه (ما نوع التدريب الذي يستبعد الصور غير المناسبة للعمل؟) وهي معضلة لشركات الذكاء الاصطناعي مثل Stability. تشكل المواد الإباحية استخدامات واسعة من الإنترنت، وكما لاحظ موقع Ars وفقًا للباحثين أن عدم تدريب النماذج على (المواد غير المناسبة للعمل) يقلل بشكل كبير من قدرتها على توليد أشكال بشرية طبيعية ودقيقة. وفي الوقت نفسه، فإن التدريب على مواد غير مناسبة للعمل جمعت من الويب يمثل مجموعة من المخاوف الخطيرة للغاية المتعلقة بالسلامة والأخلاق.

ومن أجل السلامة -وربما عدم التعرض للمقاضاة- اختارت شركة Stability استبعاد المحتوى الواضح لأشكال النساء من عملية التدريب. ولكن مستخدميها -الذين أراد عدد كبير منهم بالتأكيد إنشاء صور لنساء- يشعرون بالإحباط بوضوح إزاء المنتج النهائي.

وقال أحد مستخدمي موقع ريديت مازحًا: «أعتقد أنهم يتجهون الآن نحو الإفلاس، بطريقة آمنة وأخلاقية».

  • ترجمة: رؤى بستون
  • تدقيق علمي ولغوي: بهاء كاظم
  • المصادر: 1