Un estudio detectó que ChatGPT Health falla en la mitad de las emergencias

Actualidad26/02/2026

Investigadores evaluaron casi mil casos simulados y advirtieron que la herramienta no siempre deriva a urgencias, incluso ante ideación suicida.

La promesa era clara: ofrecer orientación médica digital capaz de guiar a los usuarios en tiempo real. Sin embargo, una evaluación independiente encendió señales de preocupación sobre ChatGPT Health, el sistema lanzado por OpenAI en enero de 2026 para triaje y consultas sanitarias. Según el informe, la inteligencia artificial falla en el 52% de los casos de emergencia.

El estudio fue realizado por investigadores de la Escuela de Medicina Icahn del Mount Sinai, quienes analizaron 960 escenarios médicos simulados. Las pruebas se basaron en 60 viñetas clínicas elaboradas por especialistas de 21 áreas distintas. El objetivo era responder una pregunta concreta: si una persona atraviesa una urgencia real y consulta a la plataforma, ¿recibe una indicación clara de acudir a emergencias?

Los resultados no fueron alentadores. En situaciones críticas, la tasa de error alcanzó el 52%, mientras que en cuadros no urgentes el margen de fallo fue del 35%. En términos prácticos, eso implica que casi la mitad de las emergencias médicas no fueron correctamente identificadas ni derivadas a servicios de atención inmediata.

La herramienta mostró mayor precisión ante cuadros ampliamente reconocidos, como accidentes cerebrovasculares o reacciones alérgicas graves. Sin embargo, presentó dificultades en situaciones menos frecuentes pero igualmente peligrosas, como cetoacidosis diabética o insuficiencia respiratoria inminente. Allí también se registraron niveles elevados de clasificación errónea.

OTRAS NOTICIAS:

Uno de los puntos más sensibles del informe se vincula con la salud mental. Los investigadores detectaron que el sistema no derivó de manera consistente a usuarios con ideación suicida hacia la línea de crisis 988 en Estados Unidos. Según el trabajo, incluso fue menos proclive a sugerir asistencia urgente cuando la persona describía un plan concreto de autolesión.

En el documento, los autores remarcaron: “la capacidad de reconocer las crisis de salud mental y conectar a los usuarios con recursos para crisis es un requisito fundamental para cualquier plataforma de salud para el consumidor. Nuestros datos muestran que este requisito no se ha cumplido de forma fiable”. La afirmación expone uno de los núcleos del debate actual sobre el uso de inteligencia artificial en contextos clínicos.

El especialista Isaac S. Kohane, director del Departamento de Informática Biomédica de la Facultad de Medicina de Harvard y ajeno al estudio, subrayó la magnitud del desafío. “Cuando millones de personas utilizan un sistema de IA para decidir si necesitan atención de emergencia, hay mucho en juego. La evaluación independiente debería ser rutinaria, no opcional”, señaló.

Antes del lanzamiento de esta versión sanitaria, OpenAI había informado que alrededor del 25% de sus 800 millones de usuarios semanales realizaba al menos una consulta médica en la plataforma. Eso equivale a unos 40 millones de personas que ya utilizaban la herramienta con fines vinculados a la salud, una cifra que explica la atención que despertó el estudio.

OTRAS NOTICIAS:

El autor principal de la investigación, Ashwin Ramaswamy, explicó la motivación detrás del trabajo: “Queríamos responder a una pregunta muy básica pero crucial: si alguien sufre una emergencia médica real y acude a ChatGPT Health en busca de ayuda, ¿le indicará claramente que debe acudir a urgencias?”. La respuesta, según los datos obtenidos, deja margen para la revisión y el ajuste del sistema.

En paralelo, los especialistas remarcan que el 73% de los pacientes continúa recurriendo primero a médicos humanos cuando necesita información de salud, frente a un 16% que consulta inteligencia artificial. Aun así, advierten que estas herramientas avanzan con rapidez y que será tarea de los profesionales capacitar a los usuarios para interpretar sus respuestas de manera crítica.

La discusión sobre el rol de la IA en la atención sanitaria crece a la par de su adopción. Mientras empresas tecnológicas impulsan soluciones cada vez más sofisticadas, la comunidad médica insiste en la necesidad de controles externos, protocolos claros y advertencias explícitas para evitar que una recomendación equivocada se convierta en un riesgo real.