ذكاء غوغل الاصطناعي الجديد اللامع يمكنه تحويل النصوص إلى موسيقى

ذكاء غوغل الاصطناعي الجديد اللامع يمكنه تحويل النصوص إلى موسيقى.

أظهر باحثو Google أحدث الحيل التي علّموها ل Music LM، وهو نموذج ذكاء اصطناعي صنعوه يمكنه تحويل المطالبات النصيّة البسيطة إلى موسيقى مكتملة. وإذا قيمنا العيّناتالتي شاركوها حتى الآن، والتي تتراوح بين 30 ثانية ومقاطع كاملةٍ مدّتها خمس دقائق، نجدها مثيرة للإعجاب ولكنّها ليست مثاليةً. خصوصاً عندما يتعلّق الأمر بالأنواع غير الإلكترونية ومحاكاة الغناء البشري.

يصوّر أحد المقاطع الصوتيّة السلسة بنحو مميز «موسيقى تصويريّة للعبة صالات». في حين يحاكي آخر موسيقى سوينغ بطريقةٍ روبوتيةٍ غريبةٍ مرعبة نوعًا ما، ولعلها ستجعل الموسيقي الراحل دوك إلينغتون يتميز غضبًا لو سمعها.

الهمهمة والتصفير

قد لا تكون هذه أول أداةٍ لتوليد الموسيقى هناك -وهذه ليست المرّة الأولى التي نصادف فيها نموذج Music LM- ولكن لها بعض الحيل الجديدة والقويّة.

فكما هو مُفصَّلٌ في ورقةٍ بحثيّةٍ شاركها الباحثون ولمّا يراجعها الأقران، هذا الإصدار من Music LM «يمكن أن يُحدَّدَ بنص ولحن معًا، بمعنى أنه يستطيع تحويل ألحان الصفير والهمهمة وفقًا للأسلوب الموصوف في النصّ».

ونرى من العينات المقدمة أن النتائج مثيرةٌ للإعجاب، إذ أمكن -بسهولةٍ- تحويل لحنٍ صغيرٍ مدّته عشر ثوانٍ من الدندنة أو الصفير إلى أداء كابيلا كامل، أو غيتارٍ منفردٍ، أو إيقاعٍ رباعي. ويمكن للذكاء الاصطناعي علاوةً على ذلك تحويل عيّنةٍ من عزف الغيتار بالإصبع إلى مقطوعةٍ ساكسفون مغوية بأسلوب الجاز.

قال الباحثون إن هذا تحسينٌ تكراريٌّ للجهود السابقة. ونشروا ورقة بحثية فيها مقارنة لأداتهم بمنافساتها، مثل الذكاء الاصطناعي المولد للموسيقى Mubert، وذكروا فيها «تظهر تجاربنا أنّ Music LM يتفوّق على الأنظمة السابقة في كلا جودة الصوت والالتزام بوصف النص».

ولكن قبل أن تسأل: لا، لن يقوم الباحثون بإصدار هذه الأداة للعامّة لسببٍ مهمٍّ، وهو: احتمال انتهاك حقوق الطبع والنشر أو «الاختلاس المحتمل للمحتوى الإبداعي»، وهو أمرٌ قد أولت له صناعة الموسيقى اهتمامًا بالفعل.

  • ترجمة: هبة الزبيبي
  • تدقيق علمي ولغوي: موسى جعفر
  • المصادر: 1