بإمكان أنظمة إنشاء الصور القائمة على الذكاء الاصطناعي إنشاء نسخ من بيانات المدرب أحيانًا وفقًا لنتائج هذا الاختبار
وجد فريق من علماء الحاسوب من غوغل وديب مايند وETHZ وكل من جامعة Princeton وBerkeley وCalifornia أن أنظمة إنشاء الصور القائمة على الذكاء الاصطناعي بإمكانها أحيانًا إنشاء نسخ من الصور المستخدمة لتدريبهم، وقد نشرت المجموعة ورقة تتضمن وصفًا لاختبار العديد من أنظمة برامج إنشاء الصور على خادم arXiv preprint.
ظهرت أنظمة توليد الصور في الأخبار مؤخرًا مثل Stable Diffusion وImagen وDall-E 2، نظرًا لقدرتها على إنشاء صور عالية الدقة، وذلك فقط اعتمادًا على مطالعات اللغة الطبيعية، وقد دُرّبت هكذا أنظمة على آلاف الصور كنماذج.
ضمن هذه الجهود الجديدة، أشار الباحثون وبعض ممن شاركوا في إنشاء أحد الأنظمة إلى احتمالية ارتكاب خطأ مهم جدًا، فقد يقوم النظام ببساطة ببث إحدى الصور في بيانات التدريب الخاصة به بدلًا من إنشاء صورة جديدة، وقد اكتشفوا أكثر من 100 حالة من أصل 1000 صورة عائدة لفترة قيامهم بالاختبارات الخاصة بهم مع تكرار ذلك إلى حد ما، وهذا ما يضعنا أمام مشكلة لأن البيانات عادةً ما تُزال من الانترنت، وللعديد منها حقوق نشر وطباعة.
وجد الفريق أثناء الاختبار أن حوالي 35% من الصور المنسوخة تضمنت إشعارات لحقوق النشر، وأن حوالي 65% لم ترفق بإشعار صريح، ما يعني أنها تنتمي غالبًا إلى الصور الخاضعة لقوانين حماية حقوق النشر العامة.
لاحظ الباحثون أن معظم أنظمة إنشاء الصور القائمة على الذكاء الاصطناعي تمر بمرحلة يُضاف خلالها تشويش لمنع عودة الصور من مجموعات البيانات، وبالتالي تحفيز النظام على إنشاء شيء جديد، كما لاحظوا قيام النظام بإضافة التشويش إلى صورة منسوخة في بعض الأحيان ما يزيد صعوبة اكتشاف أنها نسخة.
استنتج الفريق وجود حاجة لدى منتجي هذه المنتجات لإضافة المزيد من الحماية منعًا لإعادة النسخ، وأوضحوا أن آلية الإبلاغ البسيطة يجب أن تفي بالغرض.
- ترجمة: صبا ورده
- تدقيق علمي ولغوي: نور الحاج علي
- المصادر: 1