لم تنازع مولدات الذكاء الاصطناعي أثناء الكتابة والعد إن كانت خارقة الذكاء؟
لطالما أثارت أدوات مولّداتِ الذكاءِ الاصطناعي من مثل (مِدجورني) و (ستيبل دفيوجن) و (دال تو) دهشتنا بقدرتها على إنتاج صور مميزة في غضون ثوانٍ.
ومهما يكن لمولّدات الذكاءِ الاصطناعي هذه من إنجازات، فلا بدّ من وجود تفاوتٍ محيّرٍ بين ما يمكنها تقديمه وبين ما يمكننا نحن كبشر تقديمه. فعلى سبيل المثال: غالباً لن تنتج هذه الأدوات نتائج مرضيةً لمهماتٍ تبدو سهلةً كعدّ الأشياء أو تقديم نص دقيق.
وإن كان صحيحاً أن الذكاء الاصطناعي المولّدُ وصل لارتفاعات غير مسبوقة في التعبير الإبداعي، فلِمَ يبذل جهداً مع مهماتٍ يمكن لتلميذِ ابتدائية إنجازها؟
سيساعدنا اكتشاف الأسباب التالية على الإضاءة على الطبيعة العددية المعقّدةِ للذكاء الاصطناعي والفارق البسيط لإمكانياته:
حدود الذكاء الصنعي مع الكتابة:
يميّز البشر بسهولة رموز الكتابة النصيّة (كالأحرف والأعداد والأسلوب) وإن كانت مكتوبة بأنواع مختلفة من الخطوط أو حتى بخطّ اليد. كما يمكنهم إنتاج نص واحد ضمن سياقات مختلفة وفهم كيفية تغيير السياق للمعنى. وينعدم هذا الفهم الفطريُّ لدى مولدات الذكاء الصنعي الحالية مع انعدام استيعاب حقيقي لما يرمزُ له أي نص أيضًا.
وتمّ بناءُ هذه المولّدات ضمن شبكات عصبونية صنعيةٍ مدرّبة على كمياتٍ هائلةٍ من بيانات الصور حيث يتعلمون منها الربطَ والتوقّع. كما يتمُّ ربطُ الأشكال أثناء تدريب الصور مع عدّة كيانات. فمثلاً: قد يمثّلُ التقاء خطّين متجهين للداخل رأس قلم رصاص أو سطح منزل، لكننا حين نتعامل مع النصّ والكميّات فيجب أن تكون الارتباطاتُ دقيقةً جدًا ذلك أنه يمكن ملاحظة أدقِّ العيوب. وتتغاضى أدمغتنا أحيانا عن الميول البسيطة في رأس قلم الرصاص أو السقف لكنها لا تتغاضى في حالة الكلمات المكتوبة أو عدد أصابع اليد.
وحين يتعلق الأمر بتخيل نماذج الذكاء الصنعي للنصوص، فإنّ ما تقوم به هذه النماذج لا يتعدّى جمعاً للخطوط والأشكال. لذا فغالبا لن يتعلم النموذج الصنعيٌّ كيفيّة إعادة إنتاج النص بكفاءةٍ لأن النص يأتي بأشكالٍ متعدّدةٍ ولأنّ الحروف والأرقام تُستخدمُ بما يشبه ترتيباتٍ لا منتهيةٍ.
ويعتقدّ الذكاء الصنعي أن عدم كفاءته في إعادة إنتاج النصّ تكمنُ بسبب بياناتٍ تدريبيةٍ غير كافية حيث أنه يتطلّبُ بيانات تدريب على إعادة هيكلة النص والكميات بدقة أكبر بكثير مما قد تتطلبه أي مهمة أخرى.
قضية مأساة أيدي الذكاء الصنعي
برزت هذه القضية حين تطلّبَ الأمرُ تعامل الذكاء الصنعي مع تفاصيل معقّدة كرسمِ اليدين حيث غالباً ما تبدو الأيادي صغيرة وتحمل أشياء أو مغطاةٍ جزئياً بتفاصيل أخرى عند رسمها في برنامج (شاترستوك) المدرب على إنتاج الصور.
عندئذٍ أصبح الأمر بمثابة تحد للذكاء الصنعي بأن يربط مصطلح (يد) بتصورٍ دقيقٍ ليد الإنسان بخمسة أصابع لأنّ اليدَ المولَّدة بالذكاء الصنعي غالباً ما تكون مشوهة بأصابع أكثر أو أقل أو يدٍ مغطاةٍ جزئياً بأكمامٍ أو حقائب.
ويتشابه الأمر حين يتعلق بالكميات حيث تفتقر نماذج الذكاء الصنعي كلها إلى فهمٍ واضحٍ للكميات كالمفهوم المجرّد ل (أربعة). فقد يستجيب مولد الصورة بالاعتماد على التعلم من صور متنوعة تصفُ كمياتٍ متعددة من التفاح فيخرج بنتيجة خاطئة وبمعنىً آخر، فإنّ التنوع الهائل المرتبط مع بيانات التدريب يؤثر على دقة الكميات في المخرجات.
هل سيتمكّن برنامج (شاتر ستوك) للذكاء الصنعي من الكتابة والعدّ؟
من المهمّ التذكر أن تحويل النصّ أو الفيديو إلى صور، هو مفهومٌ جديدٌ نسبياً للذكاء الصنعيّ إذ إنّ المنصّاتِ المولّدة حالياً هي نسخٌ لحلولٍ ضعيفة عما يمكننا تخيله في المستقبل. وستكون مولّدات صور الذكاء الصنعي المستقبلية قابلة لإنتاج تصوّراتٍ أكثر دقة بسبب التطور الحاصل في عمليات التدريب وتكنولوجيا الذكاء.
ومما يستحق الاهتمام أيضاً أن معظم منصات الذكاء الصنعي المعروض للعامة لا تقدّم أعلى مستوى من القدرة لأنّ توليد نصٍّ وكمياتٍ دقيقة يحتاج إلى شبكات عمل مناسبة ومجهزة بشكلٍ كبير لذا ستتلقى المنصات المتقدمة ذات الاشتراكات المدفوعة نتائج أفضل.
- ترجمة: ريما إبراهيم
- تدقيق علمي ولغوي: حسام عبدالله
- المصادر: 1