Algoritmos WSI ante la FDA: cuatro autorizaciones que dibujan una ruta práctica para la patología digital - الباثولوجي الرقمي

Innolitics publicó una lectura útil de cuatro expedientes de la FDA en el análisis de portaobjetos WSI con inteligencia artificial. La importancia del artículo no está solo en los nombres de las empresas, sino en el patrón regulatorio que empieza a repetirse: el dispositivo no sustituye al patólogo, el claim clínico está delimitado con precisión y la dependencia de un escáner concreto no es un detalle técnico menor, sino parte de los límites de uso.

Los cuatro dispositivos analizados cubren una parte representativa del mercado actual: Paige Prostate mediante De Novo en 2021, ArteraAI Prostate mediante De Novo en 2025, Galen Second Read mediante 510(k) en 2025 y Genius Cervical AI mediante De Novo en 2024. Tres expedientes De Novo y un expediente 510(k). Esa proporción, por sí sola, indica que la patología digital todavía está construyendo sus precedentes regulatorios, sobre todo cuando el claim cambia de la detección del cáncer a la estimación del pronóstico a largo plazo.

De Novo sigue siendo la ruta natural cuando no hay precedentes suficientes

Paige Prostate estableció un product code bajo 21 CFR 864.3750. Más tarde, Galen Second Read utilizó esa misma vía como predicate en un 510(k). Este punto importa para cualquier equipo que desarrolle un algoritmo WSI: el primer dispositivo dentro de una categoría estrecha no solo obtiene clearance, también fija en la práctica el lenguaje regulatorio y los controles de seguridad con los que se compararán los demás.

Pero eso no significa que la ruta se haya vuelto fácil. La FDA mira el claim antes que el modelo. Una frase como “assist in detection” es muy distinta de “predict ten-year outcome”. La primera puede sostenerse con estudios de rendimiento analítico y lectores. La segunda necesita seguimiento clínico, endpoints y una separación clara entre grupos de riesgo.

Detección en próstata: Paige y Galen proponen dos modelos distintos

Paige Prostate y Galen Second Read trabajan sobre portaobjetos H&E de biopsias prostate core needle biopsy de tejido FFPE, con el objetivo de dirigir la atención del patólogo hacia áreas sospechosas. Paige da una clasificación a nivel del portaobjetos y una coordenada para la región de mayor probabilidad. Galen opera en un ámbito más estrecho: casos diagnosticados inicialmente como benignos, en los que genera una alerta y un heatmap si encuentra morfología sospechosa.

La diferencia en el workflow no es cosmética. Galen no intenta entrar en la primera lectura, sino que se coloca como una capa de seguridad después de un diagnóstico benign. Desde el punto de vista regulatorio, ese framing es inteligente porque la pregunta pasa a ser: ¿reduce el dispositivo los false negatives en casos que pasaron como benignos? No hay un intento de presentar el algoritmo como competidor de la lectura principal, y eso reduce la tensión alrededor de la responsabilidad clínica.

Las cifras publicadas en el análisis de Innolitics muestran la diferencia. Paige utilizó 728 WSI en el estudio de rendimiento analítico, con una sensibilidad del 94,5% y una especificidad del 94,0% al combinar la clasificación del portaobjetos y la exactitud de la localización. En un reader study con 16 patólogos y 527 casos, los false negatives bajaron un 7,3% sin un aumento relevante de los false positives.

Galen, en cambio, se evaluó en 347 casos diagnosticados inicialmente como benignos, con una sensibilidad a nivel del portaobjetos del 81,0% y una especificidad del 91,6%. En un reader study con 772 casos y 12 patólogos en 4 centros, la sensibilidad combinada subió del 90,5% al 93,9%, mientras que la especificidad bajó del 91,1% al 87,9%. Es un tradeoff entendible: una second read detecta más cánceres, pero añade prompts que requieren revisión humana.

La localization no es un detalle decorativo

La diferencia entre una coordenada única y un heatmap tiene efecto regulatorio. La coordenada de Paige es fácil de medir: ¿cae dentro del área anotada como cáncer o no? Estuvo dentro del área correcta en el 94,5% de los casos cancerosos. En Galen, el heatmap exige una definición más estricta de lo que significa el “lugar correcto”. Por eso el estudio utilizó una medición en dos etapas: alta sensibilidad para el área completa del mapa, y luego alta especificidad y PPV para la zona más caliente.

Estos detalles importan para el patólogo que usará la herramienta a diario. Una herramienta que señala “algún lugar” del portaobjetos no es lo mismo que una herramienta que marca una hot zone que el patólogo probablemente revisará primero. La FDA lee esa diferencia como una diferencia de riesgo, no solo como una variación de interfaz.

ArteraAI: cuando el claim pasa de detection a prognosis

ArteraAI Prostate cambia la naturaleza de la conversación. El dispositivo no busca cáncer dentro de la biopsia. Estima el riesgo de distant metastasis y de prostate cancer specific mortality a 10 años, y clasifica a los pacientes en High, Intermediate y Low. La población prevista son hombres de 55 años o más, con non-metastatic prostate cancer y candidatos a tratamiento con intención curativa.

El estudio de validación incluyó 886 pacientes en tres centros de Estados Unidos, con un median follow-up de 8,2 años. La separación entre categorías fue clara: el riesgo de distant metastasis a 10 años fue del 28,1% en High frente al 3,3% en Low, mientras que la PCSM fue del 10,2% frente al 0,6%. Aquí no basta con que el heatmap sea atractivo o que la sensitivity sea alta. El claim está ligado a una decisión terapéutica, por lo que necesita datos temporales que no pueden resumirse en un estudio corto.

La presencia de un locked algorithm en estos expedientes es esperable. No hay continuous learning después del despliegue. La versión revisada es la versión que se publica, y cualquier cambio posterior necesita una ruta controlada. El Predetermined Change Control Plan se ha convertido en una forma práctica de ampliar la compatibilidad, por ejemplo añadiendo nuevos escáneres, sin convertir cada actualización en un submission completo.

Genius Cervical AI: un sistema integrado, no un programa aislado

Hologic Genius Cervical AI trabaja sobre ThinPrep Pap test slides y usa una CNN para seleccionar objects of interest y mostrarlos al revisor dentro de categories vinculadas al sistema Bethesda. Aquí el dispositivo no es solo cloud software. El sistema incluye Genius Digital Imager, Image Management Server, Review Station y una pantalla concreta. Por eso el hardware pasa a formar parte del clearance.

Este modelo da a la empresa más control sobre la calidad de la imagen y la visualización, pero amplía el alcance de la verificación: iluminación, movimiento mecánico, sensores, enfoque, pantalla y servidor. En cambio, un modelo de software que depende de escáneres externos reduce la carga de hardware, pero ata el despliegue práctico a escáneres concretos. En los cuatro expedientes citados, Philips Ultra Fast Scanner aparece casi como un puente común. No es una observación menor para quien planea comprar o desarrollar WSI-AI; la compatibilidad del escáner puede decidir si el producto podrá usarse antes de cualquier discusión sobre la precisión del modelo.

¿Qué significa esto para el laboratorio?

Primera lección: no empiece por el modelo. Empiece por el claim clínico. ¿Quiere detectar un focus sospechoso? ¿Una second read después de un diagnóstico benigno? ¿Prognosis a diez años? ¿Triage en cytology? Cada claim arrastra un tipo distinto de estudio, endpoints distintos y un labeling distinto.

Segunda lección: el lenguaje de adjunct seguirá siendo central. Todos los dispositivos subrayan que la decisión final corresponde al patólogo o al cytologist, y que la herramienta no funciona como sustituto independiente. Esto no es una frase legal que se añade al final. Debe aparecer en el diseño del workflow: cuándo actúa el algoritmo, qué muestra y quién conserva la decisión final.

Tercera lección: la diversidad de datos y el subgroup analysis ya forman parte de la expectativa regulatoria. Los expedientes mencionan características de entrenamiento y prueba, centros, demografía, Gleason grade o NCCN risk categories cuando corresponde. Si los datos son estrechos o sesgados, el problema aparecerá durante la revisión. Es mejor resolverlo al construir la cohort que al redactar el submission.

Para el patólogo dentro del laboratorio, estos expedientes dan una forma práctica de evaluar cualquier producto nuevo antes de comprarlo: pregunte por la indication exacta, los escáneres autorizados, el lugar de la herramienta en el workflow, el tipo de estudio de validación, su efecto sobre la sensibilidad y la especificidad, y cómo se abordaron los subgroups. Las promesas de marketing valen menos que esas preguntas.

Fuente: Innolitics.