في مختبر مزدحم بحالات أورام من القولون، الرئة، البروستات، والثدي، تبدو فكرة وجود AI model واحد يتعامل مع أكثر من نوع سرطان جذابة جدا. طبيب الباثولوجي لا يريد شاشة إضافية تعرض نتيجة غامضة. يحتاج إلى أداة تعرف أين يبدأ الورم، كيف تتعامل مع اختلاف الـ morphology، وكيف تعرض قياسا قابلا للمراجعة داخل مسار WSI اليومي.
الخبر الأخير عن عمل مجموعة Dr Yuri Tolkach في University Hospital Cologne، كما عرض في مؤتمر Digital Pathology and Artificial Intelligence Europe في لندن، يفتح هذا النقاش من زاوية عملية. المجموعة بدأت بنماذج موجهة لسرطان واحد، ثم انتقلت إلى segmentation متعدد في colorectal cancer، والآن تختبر فكرة pan-tumoral algorithms. أي نموذج واحد أو عائلة نماذج تتعامل مع أكثر من نوع سرطان بدل بناء نموذج منفصل لكل عضو وكل تشخيص.
المشكلة تبدأ من annotation قبل أن تبدأ من الـ AI model
أي طبيب باثولوجي شارك في مشروع WSI يعرف أن المرحلة الثقيلة لا تكون في تشغيل الكود. المرحلة الثقيلة هي تحديد مناطق الورم، النسيج السليم، necrosis، stroma، وربط هذه المناطق بالسؤال السريري. في خبر Cologne، ذكر Tolkach أن تجهيز annotations لمشروع colorectal cancer استغرق أكثر من سنة. هذه كلفة بشرية وتشغيلية تحدد هل يستطيع المختبر بناء نموذج خاص به أم يبقى مستهلكا لأداة جاهزة.
عندما ينخفض زمن annotation من سنة إلى أيام في بعض الحالات، يتغير موقع طبيب الباثولوجي في المشروع. بدل أن يتحول إلى عامل ترسيم للحدود على آلاف الصور، يستطيع أن يراجع العينات الأصعب، يحدد حالات الفشل، ويقرر هل تعريف الورم في النموذج يطابق طريقة العمل التشخيصية في المختبر. هذه النقطة أهم من الادعاء بأن النموذج أسرع. السرعة مفيدة فقط إذا بقيت مرتبطة بمراجعة مهنية واضحة.
لماذا يهم نموذج عابر لأنواع السرطان؟
الأسلوب التقليدي في AI داخل الباثولوجي الرقمي يبني نموذجا لسرطان البروستات، وآخر للرئة، وآخر للقولون. هذا مفهوم ومريح في البحث، لكنه صعب في التشغيل اليومي. المختبر لا يريد صيانة عشرات النماذج، ولا يريد واجهة مختلفة لكل organ system. كل نموذج جديد يحتاج validation محلي، مراقبة أداء، تحديثات، وتفسير حدود الاستخدام للفريق.
فكرة pan-tumoral algorithm تحاول تقليل هذا العبء. حسب الخبر، طبقت مجموعة Cologne خمسة algorithms على أنواع أورام مختلفة، ولاحظت أداء عاليا في cervical cancers وأنواع أخرى مع دقة segmentation مشابهة. هذه نتيجة مشجعة، لكنها تحتاج قراءة هادئة. نجاح segmentation في نوع ورم جديد لا يعني جاهزية مباشرة للتقرير التشخيصي. لكنه يعني أن الـ morphology المشتركة بين الأورام قد تكفي أحيانا لبناء أداة أولية تساعد في triage أو قياس العبء الورمي أو اختيار مناطق للمراجعة.
بالنسبة لطبيب الباثولوجي، السؤال العملي هو: أين ستظهر نتيجة النموذج داخل مسار العمل؟ إذا كانت النتيجة طبقة annotation فوق WSI، فهي تحتاج ألوانا واضحة، إمكانية إخفاء الطبقة، وقياسات يمكن تتبعها. وإذا كانت النتيجة risk score أو توقع relapse، فهي تحتاج ربطا صريحا مع نوع العينة، طريقة التحضير، حدود cohort، والقرار السريري المقصود.
من التشخيص إلى التنبؤ: حدود يجب أن تبقى ظاهرة
يعرض الخبر انتقال الخوارزميات من مهام تشخيصية أساسية إلى نماذج prognostic وpredictive. هنا يصبح دور المختبر أكثر حساسية. تصنيف منطقة ورمية على H&E يختلف عن توقع relapse بعد إيقاف immune checkpoint therapy في malignant melanoma. المهمة الثانية تدخل في مساحة قرار علاجي، وتحتاج بيانات متابعة، وربطا مع molecular findings، وربما MRI أو mRNA أو بيانات علاجية.
ذكرت التغطية أيضا استخدام multi-modal models ونمذجة نمو الورم وintratumoral heterogeneity. هذه مفاهيم قريبة من الواقع اليومي لطبيب الباثولوجي، لأن الشريحة الواحدة قد تحمل أكثر من نمط growth، وأكثر من درجة differentiation، ومناطق immune-rich وأخرى immune-poor. القيمة العملية تظهر عندما يستطيع النموذج تحديد هذه المناطق بطريقة قابلة للمراجعة، لا عندما يقدم رقما نهائيا بلا تفسير مرئي.
LLMs تضيف طبقة أخرى. الخبر يشير إلى استخراج البيانات من AI parameters لتدريب الخوارزميات وإجراء analysis واسع. في المختبر، يمكن أن يكون ذلك مفيدا في تجميع findings من WSI، molecular reports، ونصوص التقارير السابقة. لكن أي استخدام قريب من التقرير يجب أن يمر عبر حوكمة صارمة: من كتب الجملة؟ من راجعها؟ هل تم حفظ الرابط بين النتيجة والشريحة؟ وهل يستطيع الباثولوجست الرجوع إلى الدليل البصري عند الاعتراض؟
التحقق السريري جزء من سلامة الاستخدام
أي نموذج عابر لأنواع السرطان سيصطدم بتباين حقيقي بين المختبرات. اختلاف scanner، طريقة fixation، staining، thickness، ونوع العينة قد يغير شكل الإشارة البصرية التي يتعلمها النموذج. لذلك لا يكفي أن يعمل النموذج على cohort من مركز كبير. المختبر الذي يريد استخدامه يحتاج اختبارا محليا على عيناته، مع حالات سهلة وصعبة، ومع artifacts شائعة في العمل اليومي.
التحقق الجيد يجب أن يجيب عن أسئلة بسيطة. هل يخطئ النموذج في mucin؟ هل يتعامل مع cautery artifact؟ هل يخلط بين inflammation والورم في مناطق معينة؟ هل تقل دقته في biopsies صغيرة؟ وهل يظل الأداء مقبولا عند اختلاف stain intensity بين دفعات العمل؟ هذه الأسئلة أقرب إلى طاولة التشخيص من أرقام accuracy العامة.
كما أن واجهة الاستخدام جزء من التحقق. إذا احتاج طبيب الباثولوجي إلى فتح نظام منفصل، رفع WSI يدويا، ثم نسخ النتيجة إلى LIS، فالفائدة ستنخفض حتى لو كان النموذج جيدا. أما إذا ظهرت النتيجة داخل image management system مع audit trail واضح، ومكان محدد في التقرير، وسهولة مراجعة للـ false positives وfalse negatives، فهنا تبدأ القيمة التشغيلية.
ما الذي يجب أن يراقبه المختبر الآن؟
أول نقطة هي تعريف الاستخدام. pan-tumoral segmentation قد يكون مناسبا كأداة قياس أو triage قبل أن يكون أداة تقرير نهائي. ثاني نقطة هي ملكية القرار. النموذج يساعد في تنظيم النظر إلى WSI، لكن توقيع التقرير يبقى قرار طبيب الباثولوجي. ثالث نقطة هي طريقة تحديث النموذج. إذا توسع من prostate إلى lung ثم colon ثم cervical cancer، فكل توسع يحتاج ملف validation واضحا، وليس مجرد وعد بأن نفس البنية تعمل في أكثر من ورم.
الخبر من Cologne مهم لأنه يحرك النقاش من نموذج منفرد إلى بنية عمل أوسع داخل oncological pathology. الطريق العملي لن يكون في استبدال خبرة الباثولوجست، بل في تقليل الوقت المهدور على annotation والقياسات المتكررة، وإظهار heterogeneity بطريقة تسهل المراجعة، وربط الصورة بمعلومات molecular وclinical عند الحاجة.
لذلك يجب أن يقرأ طبيب الباثولوجي هذا النوع من الأخبار بعين تشغيلية. ما نوع العينة؟ ما المهمة المحددة؟ كيف تمت المراجعة؟ أين تظهر النتيجة؟ وما الذي يحدث عندما يختلف الطبيب مع النموذج؟ الإجابة عن هذه الأسئلة هي التي تحول AI من عرض بحثي جيد إلى أداة قابلة للاستخدام داخل المختبر.
المصدر: Healthcare in Europe.