Prueban a la IA en una puerta de urgencias: supera a los médicos en el triaje pero sigue sin mirar a la cara del paciente
Científicos de Stanford y Harvard explican en 'Science' las pruebas que han hecho de modelos de inteligencia artificial en labores de diagnóstico frente a médicos especialistas en urgencias
Científicos de Stanford y Harvard explican en 'Science' las pruebas que han hecho de modelos de inteligencia artificial en labores de diagnóstico.
Madrid
Una de las pruebas a las que han sometido a la IA los autores de este trabajo es darle los llamados casos "raros" que se publican en The New England Journal of Medicine (NEJM). La inteligencia artificial acertó en un 78,3% de los casos. Y se acercó muchísimo a un diagnostico correcto en casi el 98 % de las ocasiones.
Más información
Sin embargo, el experimento más relevante del estudio, que publica Science, se llevó a cabo con 76 casos clínicos reales de la puerta de urgencias del hospital Beth Israel Deaconess Medical Center, en Boston, un escenario donde el tiempo apremia y los datos que el médico tiene del paciente son, muchas veces, incompletos o ambiguos.
A diferencia de otros trabajos basados en casos simplificados o académicos, aquí se utilizaron datos clínicos "no estructurados" -en bruto- extraídos directamente de lo que había pasado en las puertas de urgencias, lo que lo convierte en el ensayo de IA más proximo a la práctica médica real.
Los investigadores evaluaron el rendimiento de modelos de IA en tres momentos clave del proceso diagnóstico en urgencias. Primero, en el triaje inicial, cuando apenas hay información disponible y las decisiones deben tomarse con rapidez; después, en la evaluación por parte del médico de urgencias, cuando ya se dispone de más datos; y finalmente, en el momento del ingreso en planta o en la UCI, con información clínica más completa. En cada uno de estos puntos, tanto la inteligencia artificial como los médicos debían elaborar un diagnóstico diferencial con un máximo de cinco posibles opciones.
Las respuestas de humanos y máquinas fueron evaluadas por otros dos médicos especialistas que desconocían si el diagnóstico lo generaba una Ia o una persona. Se buscaba saber, a ciegas, qué respuestas habían sido mejores para tratar a estos pacientes reales atendidos en urgencias.
Los resultados
La IA mostró una ventaja clara, especialmente en la fase del triaje inicial: identificó el diagnóstico correcto o muy cercano en el 67,1% de los casos, frente a entre el 50% y el 55% de los médicos humanos.
A medida que aumentaba la información disponible, el rendimiento mejoraba tanto en humanos como en la IA, pero el sistema mantuvo la ventaja: alcanzó un 72,4% en la evaluación en urgencias y un 81,6% en el momento del ingreso hospitalario, superando en todos los casos a los médicos participantes.
Un aspecto especialmente llamativo es que los evaluadores apenas pudieron distinguir si un diagnóstico había sido elaborado por un humano o por la inteligencia artificial. Los autores creen que indica que "el nivel de razonamiento clínico y de presentación de los resultados es ya comparable entre la máquina y el profesional".
¿Qué supone?
Los autores interpretan los resultados como "una prueba de concepto del potencial de la IA como herramienta de apoyo clínico, especialmente en forma de segundas opiniones". Sin embargo, advierten que el experimento no captura toda la complejidad de la práctica médica real en urgencias. En la priorización de pacientes o en las decisiones "logísticas", la IA sigue teniendo solo información de texto y no puede integrar en su diagnostico "señales visuales o contextuales", por ejemplo, qué cara tiene el paciente o cómo respira.
En todo caso, el estudio sugiere que los modelos de lenguaje han alcanzado "un nivel de rendimiento que puede superar a los médicos en determinados aspectos del razonamiento diagnóstico". El reto ahora, concluyen los investigadores, es diseñar cómo integrarlos de forma segura en la practica médica diaria.
Javier Ruiz Martínez
Redactor de temas de sociedad, ciencia e innovación...Redactor de temas de sociedad, ciencia e innovación en la SER. Trabajo en el mejor trabajo del mundo: hacer radio. Me gusta contar historias desde la calle.