الذكاء الاصطناعي جيد في تشخيص الأمراض تمامًا مثل البشر

توصلت المراجعة المنهجية الأولى والتحليل التلوي من نوعه إلى أن الذكاء الاصطناعي (AI) جيد تمامًا في تشخيص المرض بناءً على الصورة الطبية مثل المتخصصين في الرعاية الصحية. ومع ذلك ، من الضروري إجراء المزيد من الدراسات عالية الجودة.

توصلت دراسة جديدة إلى أن العاملين في مجال الذكاء الاصطناعي والرعاية الصحية يتمتعون بنفس القدر من الفعالية في تشخيص المرض بناءً على التصوير الطبي.

تتناول مقالة جديدة الأدلة الموجودة في محاولة لتحديد ما إذا كان بإمكان الذكاء الاصطناعي تشخيص الأمراض بشكل فعال مثل المتخصصين في الرعاية الصحية.

على حد علم المؤلفين - أي فريقًا ضخمًا من الباحثين بقيادة البروفيسور أليستر دينيستون من مستشفيات جامعة برمنغهام NHS Foundation Trust في المملكة المتحدة - هذه هي المراجعة المنهجية الأولى التي تقارن أداء الذكاء الاصطناعي مع المهنيين الطبيين لجميع الأمراض.

بحث البروفيسور دينيستون وفريقه في العديد من قواعد البيانات الطبية لجميع الدراسات المنشورة بين 1 يناير 2012 و 6 يونيو 2019. ونشر الفريق نتائج تحليلهم في المجلة. الصحة الرقمية لانسيت.

الذكاء الاصطناعي على قدم المساواة مع المتخصصين في الرعاية الصحية

بحث الباحثون عن الدراسات التي قارنت الفعالية التشخيصية لخوارزميات التعلم العميق مع فعالية أخصائيي الرعاية الصحية عندما قاموا بالتشخيص بناءً على التصوير الطبي.

قاموا بفحص جودة التقارير في الدراسات المذكورة ، وقيمتها السريرية ، وتصميم الدراسات.

علاوة على ذلك ، عندما يتعلق الأمر بتقييم الأداء التشخيصي للذكاء الاصطناعي مقارنة بأداء المتخصصين في الرعاية الصحية ، نظر الباحثون في نتيجتين: الخصوصية والحساسية.

تحدد "الحساسية" احتمالية حصول أداة التشخيص على نتيجة إيجابية لدى الأشخاص المصابين بالمرض. تشير الخصوصية إلى دقة الاختبار التشخيصي ، الذي يكمل مقياس الحساسية.

أسفرت عملية الاختيار عن 14 دراسة فقط كانت جودتها عالية بما يكفي لتضمينها في التحليل. يوضح البروفيسور دينيستون: "لقد راجعنا أكثر من 20500 مقالة ، ولكن أقل من 1٪ منها كانت قوية بما فيه الكفاية في تصميمها وتقرير أن المراجعين المستقلين لديهم ثقة عالية في ادعاءاتهم."

"علاوة على ذلك ، قامت 25 دراسة فقط بالتحقق من صحة نماذج الذكاء الاصطناعي خارجيًا (باستخدام صور طبية من مجموعة سكانية مختلفة) ، وقارنت 14 دراسة فقط أداء الذكاء الاصطناعي والمهنيين الصحيين باستخدام عينة الاختبار نفسها."

"ضمن تلك الدراسات القليلة عالية الجودة ، وجدنا أن التعلم العميق يمكنه بالفعل اكتشاف الأمراض التي تتراوح من السرطانات إلى أمراض العيون بدقة مثل المتخصصين الصحيين. لكن من المهم ملاحظة أن الذكاء الاصطناعي لم يتفوق بشكل كبير على التشخيص البشري ".

البروفيسور أليستر دينيستون

وبشكل أكثر تحديدًا ، وجد التحليل أن الذكاء الاصطناعي يمكنه تشخيص المرض بشكل صحيح في 87٪ من الحالات ، في حين أن الاكتشاف من قبل المتخصصين في الرعاية الصحية أسفر عن معدل دقة يبلغ 86٪. كانت خصوصية خوارزميات التعلم العميق 93٪ مقارنة بالبشر بنسبة 91٪.

قد تؤدي التحيزات إلى المبالغة في أداء الذكاء الاصطناعي

كما لفت البروفيسور دينيستون وزملاؤه الانتباه إلى العديد من القيود التي وجدوها في الدراسات التي تفحص الأداء التشخيصي للذكاء الاصطناعي.

أولاً ، تفحص معظم الدراسات الدقة التشخيصية لأخصائيي الذكاء الاصطناعي والرعاية الصحية في بيئة منعزلة لا تحاكي الممارسة السريرية المنتظمة - على سبيل المثال ، حرمان الأطباء من المعلومات السريرية الإضافية التي يحتاجون إليها عادةً لإجراء التشخيص.

ثانيًا ، كما يقول الباحثون ، قارنت معظم الدراسات مجموعات البيانات فقط ، في حين أن الأبحاث عالية الجودة في الأداء التشخيصي تتطلب إجراء مثل هذه المقارنات على الأشخاص.

علاوة على ذلك ، عانت جميع الدراسات من ضعف التقارير ، كما يقول المؤلفون ، مع عدم احتساب التحليل للمعلومات التي كانت مفقودة من مجموعات البيانات المذكورة. كتب المؤلفون: "لم تذكر معظم [الدراسات] ما إذا كانت أي بيانات مفقودة ، وما هي النسبة التي تمثلها ، وكيف تم التعامل مع البيانات المفقودة في التحليل".

تشمل القيود الإضافية المصطلحات غير المتسقة ، وعدم تحديد عتبة لتحليل الحساسية والنوعية بوضوح ، ونقص التحقق من صحة خارج العينة.

"هناك توتر متأصل بين الرغبة في استخدام تشخيصات جديدة تنقذ الأرواح وضرورة تطوير أدلة عالية الجودة بطريقة يمكن أن تفيد المرضى والأنظمة الصحية في الممارسة السريرية ،" يعلق المؤلف الأول الدكتور Xiaoxuan Liu من جامعة برمنجهام.

"أحد الدروس الرئيسية من عملنا هو أنه في الذكاء الاصطناعي - كما هو الحال مع أي جزء آخر من الرعاية الصحية - يعد التصميم الجيد للدراسة أمرًا مهمًا. بدونها ، يمكنك بسهولة إدخال التحيز الذي يؤدي إلى تحريف نتائجك. يمكن أن تؤدي هذه التحيزات إلى ادعاءات مبالغ فيها بالأداء الجيد لأدوات الذكاء الاصطناعي التي لا تترجم إلى العالم الحقيقي ".

د. Xiaoxuan Liu

تضيف المؤلفة المشاركة الدكتورة ليفيا فايس من مستشفى مورفيلدز للعيون ، لندن ، المملكة المتحدة: "يجب أن تأتي الأدلة حول كيفية تغيير خوارزميات الذكاء الاصطناعي لنتائج المرضى من المقارنات مع الاختبارات التشخيصية البديلة في التجارب العشوائية ذات الشواهد"

"حتى الآن ، لا تكاد توجد أي تجارب من هذا القبيل حيث يتم اتخاذ قرارات التشخيص التي تتخذها خوارزمية الذكاء الاصطناعي لمعرفة ما سيحدث بعد ذلك للنتائج التي تهم المرضى حقًا ، مثل العلاج في الوقت المناسب ، أو وقت الخروج من المستشفى ، أو حتى معدلات البقاء على قيد الحياة."

none:  الجهاز الهضمي - أمراض الجهاز الهضمي صحة العين - العمى انف واذن وحنجرة