الذكاء الاصطناعي يتنبأ بمعدل عمل الإنزيمات

تلعب الإنزيمات دورًا رئيسيًا في عمليات التمثيل الغذائي الخلوي، ولتمكين التقييم الكمي لهذه العمليات يحتاج الباحثون إلى معرفة ما يسمى ب “رقم الدوران” (Kcat) للإنزيمات.

في المجلة العلمية Nature Communications يصف فريق من علماء المعلومات الحيوية من جامعة هاينريش هاين في دوسلدورف (Heinrich Heine University Düsseldorf – HHU) أداة للتنبؤ بهذه المعلومة لمختلف الإنزيمات باستخدام طرق الذكاء الاصطناعي.

الإنزيمات هي محفزات حيوية مهمة في جميع الخلايا الحيّة. وعادةً ما تكون الإنزيمات بروتينات كبيرة تربط جزيئات أصغر -تسمى بالركائز- ثم تحولها إلى جزيئات أخرى تسمى بالمنتجات.

بدون الإنزيمات لا يمكن أَن يحدث التفاعل الذي يحوّل الركائز إلى منتجات، أو يمكن أَن يحدث بمعدل منخفض جدًا فقط.

تمتلك معظم الكائنات الحيّة الآلاف من الإنزيمات المختلفة. وللإنزيمات العديد من الاستعمالات في مجموعة واسعة من العمليات التكنولوجية الحيوية في الحياة اليومية من تخمير عجين الخبز إلى المنظفات.

يتم تحديد السرعة القصوى التي يمكن بها لإنزيم معين تحويل ركائزه إلى منتجات من خلال ما يسمى برقم الدوران ال Kcat. فهو مقياس مهم للبحث الكمي حول أنشطة الإنزيم ويلعب دورًا رئيسيًا في فهم التمثيل الغذائي الخلوي.

ومع ذلك، فإِن تحديد أرقام دوران ال Kcat في التجارب مكلف ويستغرق وقتًا طويلاً، وهذا هو السبب في عدم معرفة الغالبية العظمى لهذه التفاعلات.

طوّرت مجموعة أبحاث بيولوجيا الخلايا الحاسوبية في HHU برئاسة البروفيسور الدكتور مارتن ليرشر Professor Dr Martin Lercher أداة جديدة تسمى TurNuP للتنبؤ بأعداد دوران ال Kcat للإنزيمات باستخدام طرق الذكاء الاصطناعي.

لتدريب نموذج تنبؤ ال Kcat يتم عبّرَ تحويل المعلومات حول الإنزيمات والتفاعلات المحفزة إلى متجهات عددية باستخدام نماذج التعلم العميق، وكانت هذه المتجهات العددية بمثابة مدخل لنموذج التعلم الآلي -يسمى بنموذج تعزيز التدرج Gradient Boosting Model- والذي يتنبأ بأرقام دوران الKcat.

المؤلف الرئيسي ألكسندر كرول قائلًا: “أن TurNuP يتفوق على النماذج السابقة ويمكن حتى استخدامه بنجاح للإنزيمات التي لها تشابه منخفض مع تلك الموجودة في مجموعة بيانات التدريب”.

النماذج السابقة لم تتمكن من إجراء أي تنبؤات ذات فائدة ما لم يكن 40% على الأقل من تسلسل الإنزيم مطابقًا لإنزيم واحد على الأقل في مجموعة التدريب. على النقيض من ذلك، يمكن ل TurNuP بالفعل إجراء تنبؤات ذات فائدة للإنزيمات بأقصى تطابق تسلسل من 0 – 40%.

يضيف البروفيسور ليرشر Lercher:

“في دراستنا، أظهرنا أَن التنبؤات التي قدمها TurNuP يمكن استخدامها للتنبؤ بتركيزات الإنزيمات في الخلايا الحيّة بشكل أكثر دقة مما كانت عليه حتى الآن”.

ومن أجل جعل نموذج التنبؤ في متناول أكبر عدد ممكن من المستخدمين، طوّر فريق HHU خادم ويب سهل الاستخدام والذي يمكن للباحثين الآخرين استخدامه للتنبؤ بأعداد دوران ال Kcat للإنزيمات.

الخلفية: التعلم الآلي والتعلم العميق

تتكون نماذج التعلم العميق من شبكات عصبية اصطناعية متعددة الطبقات يمكنها التعرف على أنماط البيانات المُدخَلة ومعالجتها. ويعد استخدام مجموعات بيانات التدريب الكبيرة، الطريقة المُثلى لتدريب نموذج التعلم العميق لمعالجة المدخلات العددية.

نماذج تعزيز التدرج هي طريقة تعلم آلي تنتج أعدادًا كبيرة من أشجار القرار.

ويتم استخدام نتائج جميع أشجار القرار لمدخلات محددة لعمل تنبؤات. على غرار التعلم العميق، يتم استخدام بيانات التدريب لتحسين النموذج، أي لإنتاج أشجار القرار.

  • ترجمة: منى اعجاز
  • تدقيق علمي ولغوي: فاطمة قائد
  • المصادر: 1