تحويل تقارير الباثولوجي النصية إلى بيانات منظمة باستخدام الذكاء الاصطناعي

تقارير الباثولوجي تكتب كنصوص سردية حرة. كل طبيب يمتلك أسلوب كتابة خاص به، وتختلف صيغة التقرير بين المستشفيات. البيانات الأساسية مثل موقع الورم، ومرحلة المرض، وحالة المؤشرات الحيوية تتوزع في فقرات مختلفة. استخراج هذه البيانات يتطلب قراءة التقرير بالكامل، والبرمجيات التقليدية تفشل في هذه المهمة لأن النص يفتقر إلى هيكل ثابت.

نشرت مجلة The Pathologist في أبريل 2026 دراسة للباحثين مارلين بوي وغلام رسول تناقش نظاما برمجيا يعالج هذه المشكلة. النظام يعتمد على نماذج لغوية كبيرة تعمل محليا لمعالجة النصوص الطبية.

يعمل النظام عبر ثلاث مراحل. تقرأ عدة نماذج لغوية التقرير وتستخرج المتغيرات الطبية مثل نوع الخلية، ومرحلة الورم، والموقع. كل نموذج يكتب تفسيرا يوضح سبب اختياره للبيانات. بعد ذلك، تراجع نماذج أخرى هذه المخرجات وتطابقها مع النص الأصلي للتأكد من صحتها. في النهاية، يقوم نموذج الإجماع بجمع النتائج وإصدار بيانات منظمة مع توثيق يوضح مسار الوصول إلى النتيجة. استخدام عدة نماذج يقلل من احتمالية الأخطاء الآلية ويطابق طريقة عمل الأطباء عند التشاور.

اختبر الباحثون النظام على أكثر من 6000 تقرير من أطلس جينوم السرطان وتقارير فعلية من مركز موفيت للسرطان. استخرج النظام المتغيرات التشخيصية الأساسية بدقة.

استخراج المؤشرات الحيوية كان المهمة الأصعب. الأطباء يكتبون نتائج المؤشرات الحيوية في أقسام متباعدة، مثل التعليقات، أو الملاحق، أو التقارير الجزيئية المنفصلة. الخوارزمية اضطرتلتجميع المعلومات من أجزاء مختلفة من النص لفهم السياق الطبي.

تنظيم هذه البيانات يسرع تطبيق الطب الدقيق. المستشفيات تستخدم هذه التقنية للبحث في آلاف التقارير وإيجاد المرضى المؤهلين للمشاركة في التجارب السريرية، بدلا من المراجعة اليدوية للملفات الطبية.

تطبيق هذا النظام في بيئة العمل يتطلب ربطه المباشر بنظام معلومات المختبر. النماذج اللغوية تعمل على خوادم المستشفى الداخلية لحماية بيانات المرضى. النظام يعرض النص المصدري الذي استندت إليه الخوارزمية، والطبيب يراجع النتيجة النهائية ويعتمدها.