تعزيز مهاراتك في المعلوماتية الحيوية باستخدام الذكاء الاصطناعي
يمكن لأدوات تحليل الصور أن تفعل أشياء مذهلة، ومع أنها قوية، إلا أن طالبة الدكتوراه في علم الأحياء في جامعة ولاية كامبيناس في البرازيل والمتخصصة في علم السموم النانوية فرناندا جارسيا فوسا Fernanda Garcia Fossa كانت محبطة، إذ يُعد تنميط الخلايا البشرية المعتمد على الصور جزءًا أساسيًا من بحثها، ولكن عندما بدأت، كانت العملية بطيئة ومعرضة للأخطاء.
استغرقت جارسيا ساعاتٍ كثيرة بينما كانت تبحث في الصور عن دليل على التأثيرات الدقيقة لأجسام الفضة النانوية في خلايا الكبد، إذ وضحت ذلك بقولها: «لقد أمضيت الكثير من وقتي في تحليل صوري يدويًا وبصورة فردية بحثًا عن الاختلافات. اعتقدت أنه يجب إيجاد طريقة أسرع للقيام بذلك».
عثرت جارسيا على أداة تدعى CellProfiler في أثناء تصفحها لمنتديات علم الأحياء على الإنترنت، وهي أداة لتحليل الصور تعتمد على الذكاء الاصطناعي (AI) وطُوّرت في معهد برود التابع لمعهد ماساتشوستس للتكنولوجيا وجامعة هارفارد في كامبريدج.
حددت جارسيا خوارزمية لتلبية احتياجاتها في غضون ساعات واستخدمتها لتحليل صورها تلقائيًا، وتقول: «لقد كان الأمر مثيرًا، فقد وجدت فجأة أن لدي المزيد من الوقت للقيام بمهام أخرى تتعلق ببحثي، لأن الأداة كانت تحلل لي جميع صوري».
إنها ليست الوحيدة، فقد أصبحت مهارات المعلوماتية الحيوية ضرورية في علوم الحياة، ويُدرَّب العلماء عادةً على الخوارزميات التي تساعدهم في أبحاثهم، وكيفية عملها واستخدامها بكفاءة. لكن الاختصاصيين في المعلوماتية الحيوية يستخدمون الذكاء الاصطناعي بشكل متزايد، بما في ذلك نماذج اللغة الكبيرة مثل chatGPT بدلًا من الخوارزميات للعثور على الميزات في التسلسلات والصور.
يقول عالم البيانات وقائد المجموعة الأولى في منصة التصوير التابعة لمعهد برود، شانتانو سينغ Shantanu Singh: «إن معدل الإقبال ينمو بسرعة، ومن المتوقع أن يصبح أسرع». العديد من الباحثين يفتقرون إلى مهارات إدارة البيانات مع أن عددًا كبيرًا منهم يعمل الآن باستخدام هذه المنصات، وهو ما يعيق تقدم هذا المجال إلى جانب نقص الموارد. ويقول: «أصبحت بعض الأشياء مثل حلول تخزين البيانات أكثر بساطة لكنها لاتزال غير كافية».
يحصد الذين انتقلوا إلى استخدام الذكاء الاصطناعي فوائد سير العمل السريع، واتخاذ القرارات المستهدفة في تحليل البيانات. لكن توجد تحدّيات يجب أخذها في الاعتبار بالنسبة لاختصاصيي المعلومات الحيوية الذين مازالوا على الحياد وذلك عند اتخاذ هذه الخطوة.
التعرف على أدوات الذكاء الاصطناعي
تساعد خوارزميات تحليل الصور الباحثين على مقارنة خصائص الخلايا بشكل أسرع وأفضل مما يحدث عندما يقومون بالعمل يدويًا. إذ يعمل الذكاء الاصطناعي على تسريع العملية من خلال التعلم التكيفي الخاص باحتياجات الباحث، ويمكن للذكاء الاصطناعي في كثير من الأحيان اكتشاف الاختلافات أو طرق المقارنة التي لم يأخذها المستخدم في الاعتبار من قبل.
يوضح سينغ: «إن فائدة استخدام الذكاء الاصطناعي في التصوير هي أنه يسمح للباحثين بالتفكير في الصور البيولوجية ذات الأبعاد العالية، وليس فقط التركيز على مقياس واحد أو اثنين محددين مسبقًا». يحول الذكاء الاصطناعي بشكل فعال صورة معقدة بيولوجيًا إلى مسألة رياضية واضحة نسبيًا. «بمجرد حصولك على هذه الأرقام، فإن بقية الأمر كله يتعلق بعلم البيانات».
على سبيل المثال، تعد CellProfiler أداة مفتوحة المصدر تسمح للمستخدمين بإعداد مسارات العمل الخاصة بهم لأتمتة تحليلاتهم (مثل قياس الأشكال أو الخصائص أو الأنماط) والتي تسمى غالبًا خطوط pipelines. يستطيع المستخدم تشغيل خوارزميات التعلم الآلي من الأدوات المصاحبة مثل CellProfiler Analyst، ويتطور لاستخدام التعلم العميق أيضًا وهو نهج أكثر ثراءً وتعقيدًا للتعرف على الأنماط المعقدة في البيانات.
وفقًا لقائدة مشروع CellProfiler والتي تدعى بيث سيميني Beth Cimini، فإن دمج التعلم العميق مع الأدوات مثل CellProfiler هو الخطوة الطبيعية القادمة للبحث القائم على الصور. فقد اُستخِدم التعلم العميق وتحليل الصور معًا طالما نملك القدرات الحسابية للقيام بذلك. كما تقول «سواء كان ذلك من خلال الإشارة إلى الأصدقاء على فيسبوك أم إنستغرام أم تنظيف الصور المجهرية والعثور على الأشياء الموجودة فيها وإحصائها».
لقد أحبت جارسيا تطبيق CellProfiler بسبب واجهته السهلة وحقيقة أنها لم تحتج إلى معرفة كيفية البرمجة إذ كانت مجرد مسألة تدريب لتتمكن من ذلك. لكن ظهرت في السنوات القليلة الماضية العديد من الأدوات الأخرى لتحليل الخلايا والصور والتي تكون أيضًا مفتوحة المصدر ومعتمدة على الذكاء الاصطناعي كما تتطلب أيضًا القليل من الخبرة في مجال البرمجة أو لا تتطلب أي خبرة على الإطلاق، مثل أداة المعهد الفيدرالي السويسري للتكنولوجيا والتي تدعى إيلاستيك، أو منصة علم الأمراض الرقمية مفتوحة في جامعة إدنبرة بالمملكة المتحدة والتي تدعى QuPath، أو أداة المركز الوطني لأبحاث الفحص المجهري والتصوير في جامعة كاليفورنيا والتي تدعى CDeep3 M.
سد الفجوات في مهاراتك
يقول جايل فاروكو Gaël Varoquaux: «يجب أن يكون اختصاصيو المعلوماتية الحيوية الذين يرغبون في بناء أدوات الذكاء الاصطناعي الخاصة مبرمجين جيدين، وأن يكونوا محدَّدين للغاية بشأن كيفية تتبع التعديلات وضمان الجودة على الكود».
فاروكووكس Varoquaux هو مدير الأبحاث في المعهد الوطني الفرنسي لأبحاث العلوم والتكنولوجيا الرقمية (Inria) في باريس، كما أنه مؤسس مشارك ل scikit-learn وهي مكتبة خوارزميات التعلم الآلي الشعبية والمجانية مصممة وفقًا للغة البرمجة بايثون. يقول فاروكووكس: «إن لغة بايثون لغة عامة، إذ يمكنك القيام بأشياء كثيرة بها مثل معالجة النصوص، والحوسبة العلمية، وتخديم الويب. إنها مفيدة للعلوم لأنه في كثير من الأحيان نضطر إلى القيام بمهام مساعدة، ولكن من الجيد أيضًا أن يكون لديك وظيفة خارج المجال الأكاديمي إذا كنت تبحث عن وظيفة». ينصح فاركووكس من أجل ذلك بمعرفة أساسيات البرمجيات والاستثمار في تلك المهارات وتحسين القدرات الرياضية والإحصائية.
يقول عالم الأبحاث في مركز ريكن لأبحاث الأنظمة الحيوية الديناميكية في كولي، كيوجر كاواجوتشي Kyogo Kawaguchi: «يمكن أن تسهل الأدوات التفاعلية مثل ChatGPT عملية الانتقال وذلك لأن البرمجة تمثل تحديًا، سواء في حد ذاتها أم بسبب المهارات التي تتطلبها مثل تهيئة البيئة الخاصة بك، وتصحيح الأخطاء، والقدرة على طرح الأسئلة بالكلمات الصحيحة». تعمل Chatbots على خفض مستوى التحدي من خلال السماح للمستخدمين بالعثور على حلول من خلال التجريب وطرح أسئلة صريحة.
يمكن للعلماء أن يصبحوا جيدين في استخدام الذكاء الاصطناعي من خلال مزيج من التعليم الرسمي والدراسة الذاتية والخبرة العملية. ابدأ باستكشاف البرامج التعليمية والدورات التدريبية التي تقدمها الجامعات عبر الإنترنت، وعلى منصات مثل Coursera وedX وUdacity. العديد منها متاح مجانًا وتتضمن مقاطع فيديو للتعلم خطوة بخطوة ويمكن متابعتها في الوقت المناسب للمتعلم. على سبيل المثال، يمتلك عالم الكمبيوتر في جامعة ستانفورد ومؤسس شركة https: //deeplearning.ai/ أندرو إنج Andrew Ng مجموعة مشهورة من البرامج التعليمية حول برمجة التعلم الآلي والتعلم العميق على موقع كورسيرا.
تتوفر أيضًا فرص التعلم المباشر والشخصي. يستضيف مثالًا المعهد الأوروبي للمعلوماتية الحيوية (EMBL-EBI) التابع لمختبر البيولوجيا الجزيئية الأوروبي في هينكستون بالمملكة المتحدة، دورات تدريبية حية بشكل شخصي أو عبر الإنترنت للأفراد والمجموعات من جميع أنحاء العالم. ستكلف الدورات التدريبية لمدة خمسة أيام هذا العام لكل مشارك 825 جنيهًا إسترلينيًا (1014 دولارًا أمريكيًا)، والتي تشمل الإقامة وتقديم الطعام لمدة أربع ليالٍ؛ عادةً ما تكلف الدورات الافتراضية لمدة خمسة أيام 200 جنيه إسترليني. مواد الدورة التدريبية والتدريب حسب الطلب والندوات عبر الإنترنت مجانية ومفتوحة للجميع.
تدعم الحكومة الفرنسية دورة تدريبية مجانية عبر الإنترنت تديرها شركة scikit-Learn وتستمر عادةً إلى 35 ساعة. يقول فاوروكوس: « هناك الكثير من البرمجة، ولكن هذا حسب التصميم، نعتقد أن هذا مفيد».
تقول مسؤولة التدريب العلمي في EMBL-EBI دايان رودريغز أروجو Dayane Rodrigues Araújo: «يتفاجأ الوافدون الجدد من مدى سهولة البدء». وتوضح أن جزءًا كبيرًا من عملها هو إيصال رسالة مفادها أن الوافدين قد لايحتاجون إلى البدء من الصفر بكتابة خوارزمية، لأن المواد اللازمة للبدء متاحة بالفعل. يقدم EMBL-EBI بنكًا من الموارد المجانية بالإضافة إلى الدورات التدريبية عبر الإنترنت بصفته منظمة حكومية وذلك حسب الطلب، ويمكن لأي شخص استخدامها دون قيود.
لا تُصب بالذعر
قد يبدو أنه من المستحيل مواكبة التطور السريع للذكاء الاصطناعي مع العديد من التقنيات الجديدة، ولكنه ليس أمرًا مهمًا.
يوضح فاوروكوس أن برنامج scitkit-learn تستخدم التعلم الآلي “التقليدي” بدلًا من التعلم العميق، لأن هدف المنصة هو إضفاء طابع ديمقراطي وتبسيط الذكاء الاصطناعي، وليس التنافس مع شركات الإنترنت الأكبر مثل جوجل.
ولكن أبعد من ذلك، فإن السعي وراء أحدث التقنيات ليس ضروريًا دائمًا. كما يقول: «بالتأكيد، يتطور الذكاء الاصطناعي بسرعة كبيرة. لكنني لا أعتقد أن العلم يتغير بشكل كبير أسبوعيًا. إذا كنا نحاول دمج أحدث الأدوات، فسوف نتبع دائمًا الأدبيات وسيكون الأمر مرهقًا وسنفشل لذلك من الأفضل أن تأخذ خطوة إلى الوراء وننتظر لنرى ما هو الأكثر فائدة».
هذه نصيحة حكيمة. ولكن هناك تحديات عملية يجب مراعاتها عند دمج الذكاء الاصطناعي في التحليل الخاص بك خصوصًا عدم اليقين والتحيز البشري الطبيعي.
تقود فيرجيني أولمان Virginie Uhlmann مجموعة بحثية لتقييم الصور الحيوية في EMBL-EBI إذ تعمل على تصميم برامج الذكاء الاصطناعي لتحليل الصور. وتوضح أن إحدى مزايا تفويض تحليل الصور البيولوجية لجهاز الكمبيوتر هو أنه يساعد على التخفيف من القيود البشرية الفطرية لدينا قائلةً: « تكمن القوة الحقيقية في التعلم الآلي في أنك لا تحاول تحديد القواعد وكتابتها بنفسك، بل تترك الأمر للآلة». كما تحذر من أن الاعتماد بشكل كبير على الذكاء الاصطناعي له مخاطره الخاصة.
تقترح فيرجيني أولمان أن تقوم بتقييم ما يخبرك به الذكاء الاصطناعي بعناية، لفهم قراره.
نصيحة أولمان: فكّر بعناية في ما يخبرك به الذكاء الاصطناعي، لتفهم كيف ولماذا اتخذ قراره. يوجد الكثير من الأمثلة المشهورة جدًا لاتخاذ قرارات غبية جدًا تؤدي بطريقة ما إلى النتيجة الصحيحة.
لدى فريق أولمان اختبار مفيد لأي ذكاء اصطناعي من خلال تكليفه بمهمة معرفة الحل. وتقول: «هذه طريقة جيدة للتحقق من أن الخوارزمية تعمل كما ينبغي».
يمكن أن يعتمد تحليل الصور مثلًا بشكل كبير على الظروف التي تم فيها التقاط صور الخلايا أو الأنسجة. يمكن لمطوري ومستخدمي التعلم الآلي مواجهة هذا التحدي من خلال الانتباه إلى المعلومات التي يقدمونها. تقول أولمان: «علي أن أفكر: هل كنت متحيزةً في الطريقة التي اخترت بها الأمثلة الخاصة بي على A وB؟ هل هذا يمثل حقًا الاختلاف بين A وB؟».
يكمن التحدي أيضًا في إدارة البيانات. يذكر سينغ أن بعض المشاريع تولد مئات التيرابايت من الصور وبيانات القياس، لكن الخبرة في علم البيانات اللازمة لتحليلها ليست متاحة دائمًا. ويقول: «نحتاج بالتأكيد إلى المزيد من الأشخاص القادرين على التعامل مع البيانات عالية الأبعاد، والذين يمكنهم التخلص من الضوضاء».
التعلم من المجتمع
أرسلت جارسيا بريدًا إلكترونيًا إلى منصة التصوير التابعة لمعهد بورد لمعرفة المزيد حول أداة CellProfiler وآخر تطوارتها. ردت مديرة المختبر والمطورة المشاركة شيميني على الفور ودعتها لرؤية عمل المختبر مباشرة.
أمضت جارسيا عامًا في ماساتشوستس حيث عملت على الدكتوراه وساعدت في تطوير CellProfiler. وتنصح قائلة: «لا تخف من الاتصال بمطوري أدوات الذكاء الاصطناعي، فمن خلال تجربتي، هم يريدون مشاركة معارفهم والحصول على تقييمات من المجتمع لتحسين الأدوات».
وفيما يخص الأشخاص الذين لا يستطيعون حضور التدريب شخصيًا، هناك مجتمع أونلاين مزدهر من مستخدمي الذكاء الاصطناعي في العلوم البيولوجية والذي يقدم أعضاؤه الدعم ومشاركة الموارد في العديد من المنتديات العالمية والإقليمية. يوصي سينغ بمواقع مثل http: //forum.image.sc/ (مجموعة نقاشية عن برامج الصور العلمية يرعاها مركز تحليل الصور الحيوية المفتوحة وهو تعاون بين معهد برود وجامعة ويسكونسن ماديسون). تشمل الخيارات الأخرى http: //biostars.org/ وGitHub والتي يستخدمها اختصاصيو المعلومات الحيوية للمناقشات عبر الإنترنت ولمشاركة الأمثلة العملية والتعليمات البرمجية.
في نهاية المطاف، أفضل طريقة لصقل مهارات الذكاء الاصطناعي هي من خلال الممارسة. تقدم منصة مجتمع علوم البيانات Kaggle بعض الحوافز، إذ يمكن لاختصاصيي المعلومات المشاركة في المسابقات المتعلقة بالذكاء الاصطناعي على المنصة والفوز بجوائز مالية كما أنه يوفر مساحة للمستخدمين لاختبار التحمل ومقارنة تصاميمهم.
تنصح جارسيا: «لا تخجل من ارتكاب الأخطاء سواء ربحت أم خسرت، فهي ليست باهظة الثمن ولا يصعب تصحيحها. من المهم تجربة البرنامج والتعلم من خلال الممارسة وبهذه الطريقة سوف تصبح شخصًا آخر قبل أن تعرف».
- ترجمة: مجد علي
- تدقيق علمي ولغوي: فريال حنا
- المصادر: 1