PRET من جامعة هونغ كونغ: اختبار جاد للذكاء الاصطناعي القليل البيانات في الباثولوجيا الرقمية - الباثولوجي الرقمي

لماذا يستحق PRET انتباه الباثولوجيين الآن؟

أعلنت جامعة هونغ كونغ للعلوم والتكنولوجيا عن نظام PRET، اختصار Pan-cancer Recognition without Example Training، كنموذج لتحليل الصور النسيجية يستطيع التعامل مع مهام جديدة اعتمادا على عدد صغير من الشرائح المشروحة أثناء الاستدلال، من دون إعادة تدريب أو fine-tuning. الخبر منشور عبر Pathology News نقلا عن MobiHealthNews، والتفاصيل التقنية والنتائج المنشورة في Nature Cancer تجعل الموضوع أقرب إلى نقاش عملي داخل أقسام الباثولوجيا منه إلى خبر تقني عابر.

الفكرة الأساسية ليست أن النموذج يعرف كل شيء مسبقا. ما يهم هنا أنه يستخدم أمثلة محلية من الصورة نفسها أو من شرائح مشروحة قليلة كسياق بصري يساعده على أداء المهمة المطلوبة. هذا النوع من in-context learning مألوف في نماذج اللغة، لكن نقله إلى WSI يفتح سؤالا مهما: هل يمكن لنماذج الباثولوجيا أن تصبح أقل اعتمادا على مجموعات تدريب ضخمة لكل ورم، ولكل مستشفى، ولكل بروتوكول مسح؟

بالنسبة للباثولوجي، هذه ليست رفاهية بحثية. أكثر ما يبطئ إدخال أدوات الذكاء الاصطناعي إلى العمل اليومي هو الحاجة إلى بيانات محلية، ووسم مرهق، واختبارات تحقق طويلة، ثم تعديل النموذج عندما يتغير السكان أو الماسح أو طريقة التحضير. إذا استطاع نموذج مثل PRET أن يقلل هذه الكلفة فعلا، فسيغير ترتيب الأولويات عند تقييم أدوات المساعدة التشخيصية.

ما الذي فعله الفريق؟

طورت الجامعة النظام بالتعاون مع Guangdong Provincial People’s Hospital وHarvard Medical School. وفقا للخبر، جرى اختبار PRET على 23 مجموعة معيارية دولية من الصين والولايات المتحدة وهولندا، تغطي 18 نوعا من السرطان وعدة مهام، منها screening، وtumour subtyping، وtumour segmentation. هذه نقطة مهمة، لأن كثيرا من نماذج الباثولوجيا تبدو جيدة في مهمة ضيقة ثم تفقد قيمتها عندما تنتقل إلى نسيج آخر أو سؤال تشخيصي آخر.

النتائج المعلنة لافتة. حقق النظام أداء أعلى من الطرق المقارنة في 20 مهمة. في فحص سرطان القولون والمستقيم وصل AUC إلى 100%، وفي segmentation لسرطان الخلايا الحرشفية في المريء وصل AUC إلى 99.54%. كما سجل 98.71% في كشف نقائل العقد اللمفاوية باستخدام ثماني شرائح فقط، مقارنة بمتوسط أداء 11 باثولوجيا بلغ 81% بحسب التقرير.

هذه الأرقام لا تكفي وحدها للحكم السريري. نحتاج دائما إلى معرفة تفاصيل اختيار الحالات، وتوزيع الدرجات، ونسب الحالات الصعبة، وطريقة تعريف ground truth. لكن الأرقام تعطي سببا واضحا لقراءة الورقة الأصلية، خصوصا أن الفريق ذكر أن معظم بيانات التحقق جاءت من مسح جديد في مستشفيات متعاونة ولم تكن متاحة علنا قبل الدراسة. هذا يقلل خطر تسرب البيانات، وإن كان لا يلغي الحاجة إلى تحقق خارجي مستقل.

ما معنى التعلم بالسياق في الشرائح؟

بحسب شرح Prof Li Xiaomeng، يستخدم النموذج patches محلية كإشارات سياقية. يعامل هذه الأجزاء كأمثلة داخل السياق، ثم ينفذ عمليات مصفوفية تسمح بالاستدلال المتكيف من دون تحديث أوزان النموذج. الصياغة التقنية مهمة هنا: نحن لا نتحدث عن أداة تعيد تدريب نفسها داخل المختبر، بل عن طريقة تجعل النموذج يستفيد من أمثلة قليلة أثناء التشغيل.

هذا التفصيل يقرب PRET من احتياجات الباثولوجيا الواقعية. في قسم مزدحم، لا يمكن بناء نموذج خاص لكل سؤال. لكن قد يكون ممكنا توفير عدد محدود من الشرائح المشروحة أو مناطق موثقة كي يستخدمها النظام في مهمة محددة. الفارق بين هذين السيناريوهين كبير من ناحية الزمن، والتكلفة، والحوكمة.

ذكر الفريق أيضا أن PRET لا يرتبط بنموذج أساس واحد. إذا ثبت ذلك عمليا، فقد يصبح طبقة تضاف إلى أكثر من foundation model في الباثولوجيا بدلا من كونه منتجا مغلقا. هذا مهم للمراكز التي تملك بنية رقمية مختلفة أو تفضل مقارنة أكثر من نموذج قبل إدخال أي أداة إلى المسار التشخيصي.

ما الذي يجب أن يطلبه الباثولوجي قبل الاقتناع؟

السؤال الأول هو حدود المهمة. أداء عال في screening أو segmentation لا يعني أداء كافيا في حالات borderline أو في أورام ذات تشابه مورفولوجي واضح. الفريق نفسه أشار إلى أن التمييز بين أورام ذات مظهر نسيجي متقارب ما زال من القيود الحالية. وهذه بالضبط المنطقة التي يحتاج فيها الباثولوجي إلى أداة دقيقة لا إلى رقم متوسط مرتفع.

السؤال الثاني هو جودة السياق. إذا كان PRET يعتمد على أمثلة قليلة، فمن يختار هذه الأمثلة؟ هل يكفي أن تكون الشرائح مشروحة، أم يجب أن تمثل الطيف الكامل للورم، ودرجات الجودة، وأنماط التلوين، والاختلافات بين الماسحات؟ الخطأ هنا قد ينتقل من مرحلة التدريب إلى مرحلة اختيار الأمثلة المرجعية. يصبح التحكم في العينة الصغيرة حاسما.

السؤال الثالث هو التكامل مع العمل اليومي. الخبر يذكر أن النموذج مفتوح المصدر بحسب Prof Xiaomeng، لكنه لم يدخل تجارب تشغيل سريرية ولم ينشر بعد داخل مسارات المستشفيات. لذلك يجب التعامل معه كاتجاه بحثي قوي لا كحل جاهز للتشخيص الروتيني. الفارق مهم، خصوصا عندما تقدم الشركات وعودا أكبر من قدرة المختبر على التحقق.

أين يمكن أن تظهر فائدته أولا؟

أرى أن الاستخدامات الأولى لن تكون في استبدال الحكم التشخيصي، بل في المهام التي لها تعريف واضح ويمكن قياسها بدقة: فرز الحالات المحتملة، اقتراح مناطق للمراجعة، quantification في مهام محددة، أو دعم segmentation عندما تكون الحدود قابلة للمراجعة البشرية. في هذه المناطق يمكن اختبار النظام ضد مسار العمل الحالي من دون رفع المخاطر السريرية مبكرا.

قد يكون PRET مفيدا أيضا للمراكز التي لا تمتلك آلاف الشرائح الموسومة لكل ورم. كثير من المختبرات خارج المراكز الكبرى لا تستطيع بناء مجموعات تدريب محلية كافية، لكنها تستطيع توفير عدد صغير من الحالات المرجعية عالية الجودة. إذا نجح هذا النهج، فقد يقلل الفجوة بين المختبرات الغنية بالبيانات والمختبرات التي بدأت التحول الرقمي حديثا.

الخلاصة العملية

PRET يضع معيارا جيدا للنقاش القادم حول نماذج الباثولوجيا: ليس عدد الشرائح في التدريب فقط، بل قدرة النموذج على التكيف مع سؤال جديد بأمثلة قليلة، وبأداء يمكن التحقق منه خارج موقع التطوير. هذا ما يهم الباثولوجي في النهاية.

لا ينبغي أن نقرأ الخبر كإعلان عن أداة جاهزة للاعتماد السريري. القراءة الأدق أنه يقدم مسارا واعدا لتقليل عبء البيانات وإعادة التدريب. الخطوة التالية يجب أن تكون تحقق سريري مستقل، مع حالات صعبة، وشرائح من أجهزة مختلفة، ومقارنة واضحة مع أداء الباثولوجيين في ظروف عمل حقيقية.

المصدر: Pathology News.