✨︎ Resumen (TL;DR):
- OpenAI despliega su modelo de generación visual con una arquitectura totalmente independiente de GPT-4o.
- Alcanza resoluciones de hasta 4K y mejora la precisión de renderizado de texto por encima del 99%.
- Reduce el tiempo de generación a menos de tres segundos, justo antes del cierre definitivo de DALL-E.
OpenAI lanzó este martes GPT Image 2, su nueva generación de inteligencia artificial visual para ChatGPT, la cual abandona el motor original para adoptar una arquitectura construida desde cero y mejorar la capacidad gráfica.
La actualización llega tras varias semanas de pruebas anónimas en la plataforma de benchmarking LM Arena. Los usuarios evaluaron modelos bajo nombres clave como “maskingtape-alpha” y “packingtape-alpha”, desconociendo que se trataba del sucesor directo de GPT Image 1.5, liberado en diciembre de 2025.
A nivel técnico, el modelo soluciona uno de los mayores problemas del sector: la legibilidad. La precisión para procesar texto subió del 90-95% a más del 99%, integrando ahora soporte para caracteres en chino, japonés, coreano y árabe. También eliminó el tono amarillo cálido que afectaba los resultados en las versiones previas.

Soporte 4K nativo y máxima velocidad
La nueva estructura compite directamente por la calidad de salida, ampliando el rango de uso comercial y creativo.
- Resolución experimental: Soporta tamaños flexibles de hasta 4K, con un borde máximo de 4,000 píxeles y un techo total cercano a los 8.3 millones de píxeles. Su antecesor apenas llegaba a los 1,536 por 1,024 píxeles.
- Formatos prácticos: Incorpora la relación de aspecto 16:9, una medida estándar para video, miniaturas y presentaciones corporativas.
- Generación ultrarrápida: Entrega resultados en menos de tres segundos, un salto de rendimiento frente a los cinco a diez segundos que tardaba la versión anterior.
La presión en el mercado del machine learning visual aceleró este despliegue. En febrero de 2026, Google lanzó Nano Banana 2 con salida 2K nativa, igualando la oferta técnica de Midjourney V8. Además, OpenAI tiene programado apagar los servidores de DALL-E 2 y DALL-E 3 el próximo 12 de mayo de 2026.
Los usuarios ya pueden ejecutar GPT Image 2 desde ChatGPT o mediante su API oficial bajo el identificador gpt-image-2. El único cuello de botella técnico actual es la falta de soporte para fondos transparentes; quienes necesiten exportar en formato PNG sin fondo deberán seguir utilizando GPT Image 1.5 por el momento.
