OpenAI lanza GPT Image 2: nueva arquitectura y hasta 4K

OpenAI lanza GPT Image 2 con nueva arquitectura, resolución 4K y alta precisión en texto para competir con Midjourney.

Por Humberto Toledo el 21 de abril del 2026 a las 12:28 pm PDT

Resume con:

✨︎ Resumen (TL;DR):

OpenAI despliega su modelo de generación visual con una arquitectura totalmente independiente de GPT-4o.

Alcanza resoluciones de hasta 4K y mejora la precisión de renderizado de texto por encima del 99%.

Reduce el tiempo de generación a menos de tres segundos, justo antes del cierre definitivo de DALL-E.

OpenAI lanzó este martes GPT Image 2, su nueva generación de inteligencia artificial visual para ChatGPT, la cual abandona el motor original para adoptar una arquitectura construida desde cero y mejorar la capacidad gráfica.

La actualización llega tras varias semanas de pruebas anónimas en la plataforma de benchmarking LM Arena. Los usuarios evaluaron modelos bajo nombres clave como “maskingtape-alpha” y “packingtape-alpha”, desconociendo que se trataba del sucesor directo de GPT Image 1.5, liberado en diciembre de 2025.

A nivel técnico, el modelo soluciona uno de los mayores problemas del sector: la legibilidad. La precisión para procesar texto subió del 90-95% a más del 99%, integrando ahora soporte para caracteres en chino, japonés, coreano y árabe. También eliminó el tono amarillo cálido que afectaba los resultados en las versiones previas.

Te podría interesar:
OpenAI presenta GPT-Rosalind: IA médica que hunde a IQVIA

Fotos de stock gratuitas de ajedrez, alta tecnología, aprendizaje automático — Foto: Pavel Danilyuk / Pexels

Soporte 4K nativo y máxima velocidad

La nueva estructura compite directamente por la calidad de salida, ampliando el rango de uso comercial y creativo.

Resolución experimental: Soporta tamaños flexibles de hasta 4K, con un borde máximo de 4,000 píxeles y un techo total cercano a los 8.3 millones de píxeles. Su antecesor apenas llegaba a los 1,536 por 1,024 píxeles.
Formatos prácticos: Incorpora la relación de aspecto 16:9, una medida estándar para video, miniaturas y presentaciones corporativas.
Generación ultrarrápida: Entrega resultados en menos de tres segundos, un salto de rendimiento frente a los cinco a diez segundos que tardaba la versión anterior.

La presión en el mercado del machine learning visual aceleró este despliegue. En febrero de 2026, Google lanzó Nano Banana 2 con salida 2K nativa, igualando la oferta técnica de Midjourney V8. Además, OpenAI tiene programado apagar los servidores de DALL-E 2 y DALL-E 3 el próximo 12 de mayo de 2026.

Los usuarios ya pueden ejecutar GPT Image 2 desde ChatGPT o mediante su API oficial bajo el identificador gpt-image-2. El único cuello de botella técnico actual es la falta de soporte para fondos transparentes; quienes necesiten exportar en formato PNG sin fondo deberán seguir utilizando GPT Image 1.5 por el momento.

Fuentes: 1, 2, 3, 4, 5