✨︎ Resumen (TL;DR):
- El modelo gratuito de ChatGPT ya responde consultas médicas con la misma calidad que los sistemas más potentes de la empresa.
- Los reportes de datos incorrectos en temas de bienestar disminuyeron un 71% en los últimos dos meses.
- La inteligencia artificial de OpenAI ayudó a diagnosticar a 18 niños con enfermedades raras en un hospital de Boston.
OpenAI anunció que GPT-5.5 Instant, el modelo predeterminado de la versión gratuita de ChatGPT, alcanzó un nivel de precisión en respuestas de salud equivalente al de sus modelos de razonamiento más avanzados, beneficiando a más de 230 millones de usuarios semanales.
Para optimizar el sistema, la tecnológica utilizó monitores que resguardan la privacidad sobre miles de millones de mensajes semanales. Gracias a esto, la tasa de respuestas con errores de precisión disminuyó un 71% en los últimos dos meses. Además, una evaluación realizada por médicos determinó que las respuestas de GPT-5.5 Instant superaron a las escritas por especialistas humanos en precisión, claridad y nivel de detalle.
HealthBench es un marco de evaluación médica que OpenAI desarrolló en conjunto con más de 260 médicos de 60 países y 26 especialidades para medir la confiabilidad de la inteligencia artificial. En esta prueba, GPT-5.5 Instant obtuvo una calificación de 51.4 puntos, superando los 49.6 de su predecesor, GPT-5.3 Instant.

Diagnósticos de enfermedades raras en Boston
Este avance coincide con un estudio de la revista NEJM AI que revela cómo el modelo o3 de OpenAI ayudó a médicos del Boston Children’s Hospital a diagnosticar a 18 niños con enfermedades raras que no se habían resuelto tras años de pruebas genéticas.
Los especialistas utilizaron la herramienta o3 Deep Research para cruzar síntomas clínicos, patrones hereditarios y literatura médica. El hospital reporta que el uso de estas tecnologías ha permitido diagnosticar más de 40 casos complejos, ahorrar 60,000 horas de trabajo y optimizar 7 millones de dólares en costos operativos.
Las limitaciones que persisten en la IA
La empresa también cuenta con ChatGPT for Clinicians, una herramienta gratuita lanzada en abril para médicos, enfermeros y farmacéuticos verificados en Estados Unidos. En la prueba profesional HealthBench Professional, el modelo GPT-5.4 obtuvo una calificación de 59.0, superando el promedio de referencia de los médicos humanos, situado en 43.7.
Sin embargo, OpenAI advirtió que los modelos aún muestran debilidades al momento de profundizar en el contexto del paciente, entender escenarios de salud global y comunicarse de forma empática y adaptada con personas que no son expertas en medicina.
