قمنا بسؤال كل من ChatGPT وDrGoogle نفس الأسئلة حول مرض السرطان، وكانت هذه إجاباتهم
لا بد وأنك قد سمعت الضجة حول ChatGPT وهو نوع من روبوتات المحادثة التي تستخدم الذكاء الاصطناعي (AI) لكتابة المقالات وتحويل المبتدئين إلى مبرمجين ومساعدة الناس على التواصل.
قد يكون ل ChatGPT دور في مساعدة الناس على فهم المعلومات الطبية، فعلى الرغم من أن ChatGPT لن يأخذ مكان التحدث إلى طبيبك في أي وقت، قريبًا، إلا أن بحثنا الجديد يظهر قدرته على الإجابة عن الأسئلة الشائعة حول مرض السرطان. وهذا ما وجدناه عندما طرحنا نفس الأسئلة على كل من ChatGPT وGoogle. قد تتفاجأ ربما من النتائج.
ما علاقة ChatGPT بالصحة؟
تم تدريب ChatGPT على كميات هائلة من البيانات النصية وذلك لإنشاء وتوليد ردود محادثات على الاستفسارات.
النصية. حيث يمثل ChatGPT حقبة جديدة من تقنية الذكاء الاصطناعي، والتي سيتم دمجها مع محركات البحث، بما في ذلك Google وBing، وذلك لتغير الطريقة التي نتصفح بها المعلومات عبر الانترنت، وهذا يتضمن الطريقة التي نبحث بها عن المعلومات الصحية.
على سبيل المثال، يمكنك طرح أسئلة على ChatGPT مثل “ما هو السرطان الأكثر شيوعًا؟” أو هل يمكنك أن تكتب لي ملخصًا بسيطًا باللغة الإنكليزية عن أشيع أعراض السرطان التي لا يجب تجاهلها “. إنه يعطي ردودًا سلسة ومحكمة. ولكن هل هي صحيحة؟
لقد قمنا بمقارنة ChatGPT ب Google
قارن بحثنا المنشور حديثا كيفية استجابة كل من ChatGPT وGoogle على الأسئلة الشائعة عن مرض السرطان. وهذا تضمن أسئلة بسيطة مبنية على حقائق مثل “ما هو مرض السرطان تحديدًا” و”ما هي أنواع السرطان الأكثر شيوعًا؟”. بالإضافة إلى أسئلة أكثر تعقيدا حول أعراض مرض السرطان وتشخيصه (كيف من المحتمل أن تتطور الحالة) والآثار الجانبية للعلاج.
بالنسبة إلى الاستفسارات البسيطة المبنية على الحقائق، قدم ChatGPT ردودًا موجزة مماثلة في الجودة لميزة المقتطف في Google، وميزة المقتطف هي “الإجابة” التي تبرزها خوارزمية Google في أعلى الصفحة.
في حين كان هناك أوجه تشابه، كان هناك أيضا اختلافات واسعة بين ردود ChatGPT وGoogle. قدم Google مراجع يمكن رؤيتها بسهولة (روابط لمواقع أخرى) مع إجاباتها بينما أعطى ChatGPT إجابات مختلفة عند طرح نفس السؤال عدة مرات.
قمنا أيضا بتقييم سؤال أكثر تعقيدًا بعض الشيء: “هل السعال علامة على الإصابة بسرطان الرئة؟”.
أشارت ميزة المقتطف ل Google إلى أن السعال الذي لا يزول بعد ثلاثة أسابيع هو عرض رئيسي لسرطان الرئة، ولكن ChatGPT أعطى ردودًا أكثر دقة حيث أشار إلى أن السعال طويل الأمد هو أحد أعراض سرطان الرئة وأوضح أيضا أن السعال هو عرض للعديد من الحالات وسيتم الطلب من الطبيب إعطاء التشخيص المناسب.
اعتقد فريقنا السريري أن هذه التوضيحات مهمة، فهي لا تقلل من احتمالية خطر الإنذار (الهجوم المباغت للمرض) فحسب بل تزود المستخدمين بتوجيهات واضحة حول الإجراءات التي يجب اتخاذها بعد ذلك-راجع الطبيب.
ماذا عن الأسئلة الأكثر تعقيدًا؟
ثم قمنا بطرح سؤال حول الآثار الجانبية لدواء محدد للسرطان: “هل يسبب دواء بيمبروليزوماب (Pembrolizumab) الحمى وهل يجب أن أذهب إلى المستشفى؟”.
لقد سألنا ChatGP هذا السؤال خمس مرات وتلقينا خمسة ردود مختلفة، ويعود ذلك إلى العشوائية المضمنة في ChatGPT والتي قد تساعد في التواصل بطريقة أقرب ما تكون للإنسان، ولكنها ستظهر ردودًا متعددة على نفس السؤال. وقد أوصت جميع الردود الخمسة بالتحدث إلى أخصائي الرعاية الصحية ولكن لم تقل جميعها أن هذا أمر عاجل أو حددت بوضوح مدى خطورة هذا التأثير الجانبي، في حين قالت إحدى الردود أن الحمى ليست من الآثار الجانبية الشائعة ولكنها لم تذكر صراحة أنها يمكن أن تحدث. على العموم، صنفنا جودة الردود من ChatGPT على هذا السؤال بأنها سيئة.
يتناقض هذا مع Google التي لم تنشئ ميزة المقتطف لهذا السؤال ويعود ذلك على الأرجح إلى تعقيد هذا السؤال وبدلًا من ذلك اعتمد Google على المستخدمين للعثور على المعلومات الضرورية واللازمة، فمثلًا قام الرابط الأول بتوجيه المستخدمين إلى موقع الويب الخاص بمنتج الشركة المصنعة حيث أشار هذا المصدر بوضوح إلى ضرورة حصول الأشخاص على عناية طبية فورية إذا كان هناك أي حمى مترافقة مع استخدام دواء بيمبروليزوماب (Pembrolizumab).
ماذا بعد؟
لقد بينا أن ChatGPT لا يقدم دائمًا مراجع واضحة للعيان لردوده فهو يعطي إجابات متفاوتة من أجل استفسار واحد محدد ولا يتم تحديثه في الوقت الفعلي. كذلك يمكن أن يعطي ردودًا غير صحيحة بأسلوب يتسم بالثقة.
روبوت الدردشة الجديد من Bing والذي يختلف عن ChatGPT، تم إصداره منذ دراستنا، لديه عملية أكثر وضوحًا وموثوقية لتحديد المصادر المرجعية ويهدف إلى تحديثها قدر الإمكان. يوضح هذا مدى سرعة تطور هذا النوع من تقنية الذكاء الاصطناعي وأنه من المرجح أن يزداد بشكل كبير توافر روبوتات الدردشة بالذكاء الاصطناعي تكون أكثر تقدمًا وذلك بشكل تدريجي.
ومع ذلك، في المستقبل، سيحتاج أي ذكاء اصطناعي يستخدم كمساعد افتراضي للرعاية الصحية إلى أن يكون قادرًا على الإبلاغ عن عدم يقينه بشأن ردوده بدلًا من إعطاء ردود غير صحيحة، وتقديم ردود موثوقة باستمرار.
نحن بحاجة إلى تطوير الحد الأدنى من معايير الجودة لتدخلات الذكاء الاصطناعي في الرعاية الصحية وهذا يتضمن التأكد من أنها تولد معلومات قائمة على بينات وحقائق.
نحتاج أيضًا إلى تقييم كيفية تنفيذ المساعدين الافتراضيين للذكاء الاصطناعي للتأكد من أنهم يحسنون صحة الناس وليس لديهم أي عواقب غير متوقعة.
هناك أيضًا احتمال أن يكون مساعدو الذكاء الاصطناعي الذين يركزون على الطبابة مكلفين مما يثير تساؤلات حول العدالة والإنصاف ومن يمكنه الوصول إلى هذه التقنية.
أخيرًا، يحتاج اختصاصيو الرعاية الصحية إلى أن يكونوا على دراية بابتكارات الذكاء الاصطناعي هذه حتى يتمكنوا من مناقشة حدود هذه التقنية مع مرضاهم.
- ترجمة: يارا محمود
- تدقيق علمي ولغوي: قيس شعبية
- المصادر: 1