اختراق الذكاء الاصطناعي لشيفرة الحياة الثانية

ساعد التقدم في علم الوراثة والذكاء الاصطناعي العلماء على اختراق شيفرة الحياة الثانية (تنظيم الجينات).

فهم كيفية تنظيم الجينات

يوفر رمز الحمض النووي الخاص بنا مخططًا للحياة، مما يمكّن آلاتنا الخلوية من إنتاج بروتينات تؤدي الوظائف الجزيئية الأساسية.

بينما تمتلك كل خلية نفس رمز الحمض النووي، فإن تنظيم جينات معينة داخل تلك الخلية يساهم في وظيفتها الفريدة.

يجب «تشغيل» الجينات أو «إيقاف تشغيلها»، وهي عملية يتم تنسيقها بواسطة عدد من العوامل بما فيها ما يسمى ب «المعززات».

المعززات: هي تسلسلات الحمض النووي التنظيمية التي تتفاعل مع منطقة محفز الجين (حيث يبدأ النسخ) للتأثير على التعبير الجيني، وفي بعض الأحيان تكون هذه المعززات قريبة جدًا من منطقة المحفز، ولكن في حالات أخرى تكون بعيدة.

تشكل المعززات بشكل أساسي «الشيفرة الثانية للحياة»؛ لأنها تنسق كيفية تنظيم جيناتنا، لكن دراستها لم تكن سهلة.

وعلى الرغم من اكتشافنا لها في الثمانينيات، إلا أن فهمنا لكيفية عمل المعززات بدأ في الازدهار مؤخرًا بفضل التقدم في علم الجينوم والذكاء الاصطناعي (AI).

استخدم مختبر الدكتور ألكسندر ستارك، أحد كبار قادة المجموعة في معهد أبحاث علم الأمراض الجزيئية (IMP) بفيينا، هذه الأدوات في مهمته لاختراق رمز الحياة الثاني.

في ورقة بحثية نُشرت في مجلة Nature، أعلن فريقه عن نجاحهم في تحقيق ثلاثة أهداف رئيسية:

  1. التنبؤ بنشاط المعززات من تسلسل الحمض النووي الخاص بهم.
  2. التنبؤ بعواقب الطفرات في المعززات.
  3. تصميم المعززات الاصطناعية من الصفر.

يمكن للباحثين الآن قراءة وكتابة وفهم رمز الحياة الثاني.

طور ستارك وزملاؤه نموذجًا قويًا للتعلم العميق والتعلم النقلي، وزودوه ببيانات من أنواع مخبرية شائعة الاستخدام Drosophila melanogaster (ذبابة الفاكهة).

تم تزويد النموذج ببيانات تسلسل الحمض النووي على مستوى الجينوم وبيانات إمكانية الوصول إلى الحمض النووي المقابلة، واستُخدِمت هذه العملية لضبط نموذج ثانٍ يمكنه ربط تسلسلات الحمض النووي مباشرة بأنشطة معززات محددة.

ويمكن للنماذج أيضًا التنبؤ بنشاط المعزز عبر الجهاز العصبي المركزي، وقسم فرعي من الدماغ، والبشرة، والأمعاء، والأنسجة العضلية في ذبابة الفاكهة Drosophila melanogaster.

ثم اختبر ستارك وفريقه 40 محسنًا اصطناعيًا تم تصميمها حسابيًا في ذباب الفاكهة الحية، واكتشفوا أن المعززات كانت نشطة وقادرة على قيادة التعبير الجيني في أنسجة معينة.

كان من دواعي سرور Technology Networks إجراء مقابلة مع Stark حول هذا العمل الجديد، والذي يقول أنه يمثل ذروة حياته المهنية منذ بدء مختبره في عام 2008.

مولي كامبل (MC): “تم الاعتراف بوجود المعززات منذ أوائل الثمانينيات، هل يمكنك التحدث عن أي أعمال بحثية رئيسية تم نشرها منذ ذلك الحين ساعدت في وضع الأسس لدراستك الجديدة؟”.

ألكسندر ستارك (AS): “كان العمل الرئيسي الذي مكّن هذه الدراسة على ثلاث جبهات:

  1. التوصيف الشامل لوظيفة المعزز عبر الكائنات الحية في الأنسجة، وهي دراسة أجريناها منذ حوالي 10 سنوات.
  2. إدراك أن المعززات لها بصمات كروماتين مميزة، بالإضافة إلى القدرة على قياس هذه البصمات عبر جينومات كاملة بطرق تعتمد على تسلسل الجيل التالي، وبالنسبة لخاصية إمكانية الوصول إلى الحمض النووي، فقد كان تطوير ATAC-seq وATAC-seq أحادي الخلية (Buenrostro et al., Nature Methods 2013; الطبيعة 2015) ضروريًا.
  3. التقدم المذهل في مجال الذكاء الاصطناعي والتعلم العميق، والذي يتضمن تطبيق التعلم العميق على علم الجينوم مثل إمكانية الوصول إلى الحمض النووي ومجموعات بيانات ربط عامل النسخ، والتنبؤ بنشاط المعزز في نوع خلية واحد محدد.

وكان هذا الأخير دليلًا هامًا على مفهوم هذا العمل “.

مولي كامبل: “هل يمكنك التحدث عن العوامل الرئيسية التي أعاقت التنبؤ والتصميم الجديد للمعززات ذات الأنشطة الخاصة بالأنسجة؟”.

ألكسندر ستارك: “هناك أمران بحاجة إلى الاجتماع معًا لجعل هذا الإنجاز ممكنًا الآن، وهما بيانات تدريب كبيرة بما يكفي ونهج حسابية قوية بما يكفي، وقد أصبح كلاهما متاحًا فقط في السنوات الماضية من خلال طرق تعتمد على تسلسل الجيل التالي على مستوى الجينوم لتحديد خصائص الكروماتين للمحسنات واختبار المعزز الوظيفي المكثف، ومع الشبكات العصبية التلافيفية (CNNs) التي يمكن تزويدها بهذه البيانات لنمذجة الخصائص والأنشطة المعززة مباشرة من تسلسل الحمض النووي”.

مولي كامبل: “هل يمكنك شرح كيف استخدمت التعلم العميق ونقل التعلم لتصميم معززات خاصة بالأنسجة في جنين ذبابة الفاكهة؟”.

ألكسندر ستارك: “تعد شبكات CNN أدوات ذكاء اصطناعي قوية جدًا يمكنها تعلم المهام المعقدة من البيانات الأولية، بما في ذلك الاكتشاف الجديد للأنماط ذات الصلة بمهمة التعلم. ومع ذلك، للوصول إلى هذه القوة نحتاج إلى مجموعات بيانات كبيرة جدًا لتزويد نماذج «التعلم العميق»، ويعد نقل التعلم هذا نهجًا أساسيًا عندما لا تتوفر مجموعات بيانات تدريب كبيرة بما يكفي للمهمة المستهدفة، ولكنها موجودة لمهمة ذات صلة، يسمح لنا نقل التعلم بإعادة استخدام المعرفة بين المهام، إذ يمكنك أولًا تدريب نموذج للمهمة ذات الصلة -في تجربتنا إمكانية الوصول إلى الحمض النووي وفقًا لقياس scATAC-seq- ثم ضبط النموذج أو تحسينه للمهمة المستهدفة. في حالتنا، عدلت خطوة التعلم الثانية بالنقل النموذج من التنبؤ بإمكانية الوصول إلى نشاط التنبؤ.

المثال الكلاسيكي للتعلم النقلي هو كما يلي: تخيل أنك تريد تدريب نموذج للتعرف على القطط في الصور، ولكن لديك فقط عدد قليل نسبيًا من صور القطط المتاحة. يمكنك أولاً تدريب النموذج على صور الكلاب -التي لديك الكثير منها- ثم ضبط النموذج في خطوة ثانية للتعرف على القطط “.

مولي كامبل: “لماذا نريد أن نكون قادرين على تصميم معززات اصطناعية؟ وما هي الآثار المترتبة على القيام بذلك؟”.

ألكسندر ستارك: “تصميم المحسنات هو دليل على أن نماذج الذكاء الاصطناعي التي بنيناها للتنبؤ بمعززات، قوية بما يكفي إذ يمكنها توليد معززات اصطناعية من الصفر، وهذا أيضًا يثبت صحة قواعد النماذج ويعزز فهمنا بمعنى البيولوجيا الاصطناعية، وكما قال ريتشارد فاينمان ذات مرة:” ما لا يمكنني إنشاؤه، لا أفهمه “، ستغير هذه النماذج التي تم التحقق من صحتها قواعد اللعبة في تفسير الطفرات التنظيمية في الفضاء غير المشفر لجينوماتنا، «المادة المظلمة» لحمضنا النووي. علاوة على ذلك، يمكن أن يسمح تصميم المعززات في النهاية بالتعبير الدقيق عن الجينات للعلاج أو التشخيص، على سبيل المثال عن طريق المعززات المصممة للتنشيط فقط في أنواع معينة من الخلايا أو حالات معينة من الخلايا، كتحول الخلايا لتصبح سرطانية”.

مولي كامبل: “هل يمكنك مناقشة التحديات الرئيسية التي واجهتها في دراستك؟”.

ألكسندر ستارك: “كان أحد التحديات هو توافر بيانات التدريب، لا سيما عدد المعززات المميزة وظيفيًا للأنسجة المختلفة، مما حد من اختيار الأنسجة إلى فئات الأنسجة الواسعة إلى حد ما. بصرف النظر عن ذلك، فإن التحدي الإضافي يتمثل في حقيقة أن معززات بعض الأنسجة مثل الأمعاء لها قواعد أكثر تعقيدًا من العضلات، هذا يعني أن نماذج العضلات كانت في النهاية أكثر نجاحًا مما كان متوقعًا، في حين أن نماذج الأمعاء لم تكن كذلك؛ على الأرجح لأن نماذج التسلسل لعوامل النسخ GATA المهمة لمعززات الأمعاء تستخدم أيضًا على نطاق واسع في الأنسجة الأخرى”.

مولي كامبل: “يوضح بحثك جدوى التصميم المستهدف للمعززات الاصطناعية للأنسجة المختارة. ما هي خطواتك القادمة؟”.

ألكسندر ستارك: مع هذا الدليل الأول على إمكانية نمذجة الكود التنظيمي الجيني، نريد أن نذهب في عدة اتجاهات مهمة، إذ نود تصميم معززات للأنواع الفرعية للأنسجة وأنواع الخلايا الفردية، بما في ذلك التحولات بين أنواع الخلايا أثناء التطوير، وسنقوم أيضًا بصياغة وبناء معززات اصطناعية لأنواع الخلايا والحالات المهمة أثناء تجديد الفقاريات والأمراض مثل السرطان. أنا مقتنع بأن الفرص التشخيصية والعلاجية التي تنشأ من القدرة على التنبؤ بعواقب الطفرات في التسلسل التنظيمي غير المشفر أو القدرة على توجيه التعبير الجيني بدقة إلى خلايا معينة وليس خلايا أخرى ستكون ثورية “.

  • ترجمة: حلا المصري
  • تدقيق علمي ولغوي: روان نيوف
  • المصادر: 1