
الذكاء الصناعي يتنبأ بكيفية عمل الطفرات الوراثية المخفية
طور الباحثون نموذجًا للذكاء الصناعي AI يتنبأ بدقة بالنشاط الوراثي لأي خلية بشرية، ويزود بإشارات تدل على وظائف الخلايا وآلية حدوث الأمراض.
وقد دُرّب النموذج علي بيانات أكثر من 1.3 مليون خلية، ليستطيع التنبؤ بالتعبير الوراثي في أنواع الخلايا غير المرئية وبدقة عالية.
لقد كشف بالفعل عن الآلية التي يتبعها سرطان الدم لدى الأطفال والتي ربما ستساعد بالكشف عن “المادة السوداء” للجينوم (جميع المعلومات الوراثية داخل الكائن الحي)، التي تحدث فيها معظم الطفرات المسببة للسرطان.
حقائق رئيسة
الذكاء الصناعي والنشاط الوراثي:
يتنبأ النموذج بالتعبير الوراثي للخلايا المختلفة غير المرئية باستخدام بيانات الجينوم والتعبير الجيني، مما يتيح فهمًا أعمق للوظائف الخلوية.
اكتشاف سرطان الأطفال:
حدد النموذج كيف تعطّل طفرات معينة عوامل النسخ في سرطان الدم الوراثي لدى الأطفال، وأكّدت ذلك التجارب المخبرية.
كشْف “المادة السوداء” للمورثة:
يوفر النموذج أداةً لدراسة المناطق غير المشفرة في المورثة، مما يسلط الضوء على دور الطفرات غير المكتشفة بالسرطان والأمراض.
استخدم الباحثون في جامعة كولومبيا كلية فيغاس للأطباء والجراحين نموذجًا للذكاء الصناعي يستطيع التنبؤ بدقة بنشاط المورثات ضمن الخلية البشرية، ويوضّح سير العمليات الوظيفية بداخلها.
كان قد وُصِفَ هذا النموذج في العدد الحالي من مجلة نيتشر Nature، إذ يمكن أن يغير النموذج طريقة العلماء في فهم كل شيء عن أمراض السرطان والأمراض الوراثية.
فيقول راؤول رابدان، أستاذ علم الأحياء النظمي والمؤلف الرئيس للورقة البحثية الجديدة: “تسمح النماذج الصناعية التنبؤية القابلة للتعميم بالكشف عن العمليات الحيوية بسرعة وبدقة.
ويمكن لهذه النماذج الصناعية أن تجري تجارب حاسوبية بفعالية وعلى نطاق واسع، مما يعزز الأساليب المخبرية التقليدية ويوجهها “.
وتعد أساليب البحث التقليدية في علم الأحياء جيدة في الكشف عن أداء الخلايا لوظائفهم أو رد الفعل نحو أي اضطراب.
إلا أنها لا تستطيع أن تتنبأ بكيفية عمل الخلايا أو طريقة استجابتها للتغيرات، كالطفرات المسببة للسرطانات.
ويضيف رابدان: “قد يغير إدراكنا للعمليات الحيوية الأساسية القدرة على التنبؤ بأنشطة الخلايا بدقة، كما قد يحوّل علم الأحياء من علم يصف عمليات تبدو وكأنها تحدث عشوائيًا إلى علم يمكنه التنبؤ بالأنظمة الأساسية التي توجه سلوكيات الخلية”.
في السنوات الأخيرة، أدّى تراكم كميات هائلة من بيانات الخلايا والبدء باستخدام أقوى نماذج الذكاء الصناعي إلى تحويل علم الأحياء إلى علم تنبؤي.
وقد مُنحت في عام 2024 جائزة نوبل في الكيمياء للباحثين عن عملهم الرائد باستخدام نماذج الذكاء الصناعي للتنبؤ ببنية البروتين، فاستخدام هذه النماذج للتنبؤ بأنشطة المورثات والبروتينات داخل الخلية ليست بالعملية السهلة.
طريقة جديدة للذكاء الصناعي تتنبأ بالتعبير الوراثي داخل أي خلية.
في دراسة حديثة، حاول رابدان وزملاؤه استخدام الذكاء الصناعي للتنبؤ بأنشطة المورثة داخل خلية معينة. إذ يمكن للتعبير الوراثي أن يعطي الباحثين معلومات وفيرة عن هوية الخلية وكيف تقوم بوظائفها.
يوضّح رابدان: “دُرّبت النماذج السابقة على بيانات لأنواع خلايا معينة، عادةً تكون هذه الخلايا إما سرطانية أو شبيهة بالخلايا الطبيعية إلى حد ما”.
إذ قرر شي فو، طالب الدراسات العليا في مختبر رابدان سلوك نهج مختلف، فدرّب نموذجًا تعليميًا آليًا على البيانات التعبيرية للمورثة لملايين الخلايا المأخوذة من أنسجة بشرية طبيعية.
وأظهرت المدخلات المكوّنة من تسلسل المورثات وبياناتها الأجزاء التي يمكن الوصول إليها في المورثة والتعبير عنها.
وتتشابه الطريقة العامة التي يعمل بها هذا النموذج مع طريقة الشات جي بي تي chatGPT والنماذج “الأساسية” الشهيرة الأخرى.
وتستخدم هذه النماذج مجموعة من البيانات المدرّبة لتحديد القواعد الأساسية أو القواعد اللغوية، ثم تطبق تلك القواعد المستنتجة فيما بعد على المواقف الجديدة.
يقول رابدان: “وهنا يحدث الشيء نفسه:” نكتشف القواعد في العديد من الحالات الخلوية المختلفة، ثم ننتقل إلى حالة معينة سواءً كانت خلية مريضة أو خلية طبيعية، ونحاول أن نرى دقة النماذج في التنبؤ من خلال المعلومات الموجودة في الخلايا “.
وسرعان ما انضم رابدان وفو إلى فريق من المتعاونين، وهما المؤلفان الأولان أليخاندرو بوينديا الذي أصبح الآن طالب دكتوراه في ستانفورد وكان سابقًا في مختبر رابدان، وشينفتونغ مو من جامعة كارنيجي ميلون، لتدريب النموذج الجديد واختباره.
إذ بات النموذج قادرًا على التنبؤ بدقة بالتعبير الوراثي لمختلف أنواع الخلايا التي لم يسبق له رؤيتها، وذلك بعد تدريبه على بيانات أكثر من 1.5 مليون خلية بشرية، مما أدى إلى توافق النتائج بشكل كبير مع البيانات التجريبية.
نموذج الذكاء الصناعي الجديد كشف عن مسببات سرطان الأطفال.
بعد ذلك، أظهر الباحثون قوة نموذجهم عندما طلبوا منه الكشف عن الخلايا الحيوية للمرض التي لا تزال كامنة، كما في حالة سرطان الدم الوراثي الذي يصيب الأطفال.
يقول رابدان، وهو أيضًا مشارك في إدارة برنامج أبحاث المورثات والمورثات اللاورثية للسرطان في مركز هيربيرت إيرفينج الشامل للسرطان في جامعة كولومبيا: “يرث هؤلاء الأطفال طفرة متحورة، ولكن لم يتضح بالضبط ما الذي تفعله هذه الطفرات”.
وباستخدام الذكاء الصناعي تنبّأ الباحثون بأنّ الطفرات تُعطّل التفاعل بين عامليين نسخيين مختلفيين يحددان مصير خلايا الدم، وأكدت هذا التنبؤ التجارب المخبرية، وقادت إلى فهم تأثير هذه الطفرات للكشف عن آليات محددة تقف وراء تطور هذا المرض.
الذكاء الصناعي يمكنه الكشف عن “المادة السوداء” في المورثة.
إنّ النماذج الصناعية الجديدة من شأنها أيضًا السماح للباحثين بالبدء باكتشاف دور “المادة السوداء” للمورثة، وهذا المصطلح مستعار من علم الكونيات ويشير إلى الغالبية العظمى من المورثة التي لا تشفر مورثات معروفة لا في السرطان ولا في أمراض أخرى.
فيقول رابدان: “تقع الغالبية العظمى من الطفرات لدى مرضى السرطان في المادة المظلمة للمورثات، ولا تؤثر هذه الطفرات على وظيفة البروتين وتظل غير مكتشفة في الغالب، وتكمن الفكرة في طريقة استخدام هذه النماذج لفحص الطفرات وكشف ذلك الجزء من المورثة”.
وبالفعل، يعمل رابدان مع الباحثين في جامعة كولومبيا والجامعات الأخرى لاكتشاف السرطانات المختلفة، بدءًا من سرطان الدماغ إلى سرطان الدم، بالإضافة إلى فهم القواعد التنظيمية في الخلية الطبيعية، والتغيرات التي تطرأ على هذه الخلايا في حال إصابتها بالسرطان.
يفتح العمل أيضًا أفقًا جديدًا لفهم العديد من الأمراض المتعلقة بالسرطان وإمكانية تحديد مسارات علاجية جديدة. وذلك من خلال تقديم طفرات جديدة للنماذج الصناعية، كما يستطيع الباحثون حاليًا التقاط إشارات عميقة والتنبؤ بدقة بتأثير الطفرة على الخلية.
وفي أعقاب التطورات الأخيرة للذكاء الصناعي المطبق على علم الأحياء، يرى رابدان هذا العمل كجزء من اتجاه رئيس: “إنها حقًا حقبة جديدة في علم الأحياء المدهشة إلى حد كبير؛ فهي تحول علم الأحياء إلى علم تنبؤي”.
تجريد الورقة البحثية
يتضمن النسخ الوراثي تفاعلًا معقدًا بين التسلسلات التنظيمية والبروتينات ويوجه كل العمليات الحيوية.
ومع ذلك، تفتقر كل النماذج الصناعية التي تحاكي عملية النسخ القدرة على التعميم، مما يصعّب تنبؤها بدقة في أنواع الخلايا أو الظروف الطارئة.
وهنا نقدم محول التعبير العام GET (General Expression Transformer)، وهو نموذج أساسي قابل للتفسير مصمم لاكتشاف القواعد التنظيمية ل 213 نوع من الخلايا البشرية الوراثية الجنينية والبالغة.
كما يعتمد نموذج GET حصريًا على بيانات إمكانية الوصول للكروماتين ومعلومات التسلسل الوراثي ويحقق دقة تجريبية في التنبؤ بالتعبير الوراثي حتى في أنواع الخلايا التي لم تشاهد سابقًا.
يظهر GET قدرة واضحة على التكيف مع منصات تسلسلية جديدة واختبارات مختلفة، مما يتيح استنتاجات تنظيمية من خلال مجموعة واسعة من الخلايا والظروف المتنوعة، كما يكشف عن شبكات لتفاعل عوامل النسخ العامة والمحددة لنوع الخلية.
وقيّمنا أدائه في التنبؤ بالأنشطة التنظيمية، واستنتاج العناصر والعوامل التنظيمية، وتحديد التفاعلات الفيزيائية بين عوامل النسخ، ووجدنا أنه يتفوق على النماذج الحالية في التنبؤ بنتائج اختبار التقارير المتوازية الضخمة القائمة على الفيروسات البطيئة.
لقد حددنا مناطق تنظيمية بعيدة (أكثر من 1 مليون قاعدة نتروجينية) موجودة في أرومة الحمراء الجنينية تجاهلتها النماذج السابقة. وفي الخلايا البائية B، حددنا تفاعلًا معينًا للخلايا اللمفاوية بين عامل نسخ وعامل نسخ آخر، مما يوضح الأهمية الوظيفية للطفرة الوراثية التي ترفع خطر الإصابة بسرطان الدم (اللوكيميا).
باختصار، نقدم نموذجًا دقيقًا يمكنه تعميم عمليات النسخ، بالإضافة إلى قوائم تنظيم الجينات وتفاعلات عوامل النسخ، كل ذلك مع تحديد خصوصية نوع الخلية.
- ترجمة: آيات حبيب
- تدقيق علمي ولغوي: حسام عبدالله
- المصادر: 1