💡 Resumen (TL;DR):
- Microsoft lanzó MAI-Image-2 y lo integró de inmediato en Copilot y Bing Image Creator.
- El modelo saltó a la quinta posición individual y tercera por familia en el ranking global de Arena.ai.
- El lanzamiento acelera la independencia tecnológica de Microsoft frente a los modelos de OpenAI.
Microsoft presentó este jueves MAI-Image-2, su modelo de segunda generación para crear contenido visual. La herramienta, construida por el equipo de Superinteligencia de Microsoft AI, ya opera dentro de Copilot y Bing Image Creator, y marca un avance agresivo de la compañía para dominar el mercado sin depender de terceros.
MAI-Image-2 es un modelo de generación de texto a imagen que compite directamente con las opciones de Google y OpenAI. Actualmente ocupa la quinta posición en el ranking individual de la plataforma Arena.ai, pero alcanza el tercer lugar como “familia de modelos”, solo por detrás de los gigantes mencionados y el sistema GPT-Image-1.5. Esto representa un salto drástico frente a su predecesor, MAI-Image-1, que debutó en el noveno lugar en octubre de 2025.
El CEO de Microsoft, Satya Nadella, confirmó el despliegue a través de X, señalando que el sistema está “disponible ahora en MAI Playground para todo, desde realismo fotográfico hasta infografías detalladas”.
De acuerdo con la compañía, el desarrollo integró a fotógrafos, diseñadores y artistas visuales. Entre sus ventajas principales destacan:
- Iluminación natural y precisión en los tonos de piel.
- Capacidad superior para renderizar texto legible dentro de las imágenes.
- Formato ideal para crear pósters, infografías y diagramas.
El acceso a la API ya está habilitado para clientes empresariales selectos, como la agencia de publicidad WPP. Los desarrolladores generales podrán usarlo pronto mediante Microsoft Foundry, aunque la empresa mantiene en privado las especificaciones técnicas, precios y datos de entrenamiento.

Autosuficiencia frente a OpenAI
Este despliegue ocurre días después de una fuerte reestructuración interna. El lunes, Nadella anunció que Mustafa Suleyman dejaría su rol general como CEO en Microsoft AI para dedicarse exclusivamente al equipo de Superinteligencia y sus modelos de frontera. En paralelo, Jacob Andreou, exdirectivo de Snap, tomó el control absoluto de la división unificada de Copilot.
La velocidad de estos lanzamientos confirma la estrategia de Microsoft para construir su propio ecosistema. En agosto de 2025, la compañía lanzó sus primeros modelos de voz y texto, seguidos por MAI-Image-1 en octubre. Este camino se desbloqueó tras renegociar su acuerdo con OpenAI a finales de 2024, lo que le permitió buscar la inteligencia artificial general de forma independiente.
Como señaló el medio especializado The Next Web: “hace un año, Microsoft generaba imágenes para Bing y Copilot casi por completo con los modelos de OpenAI”. Esa dependencia desaparece rápidamente, aunque The Decoder advierte que la brecha técnica entre MAI-Image-2 y los modelos líderes de Google y OpenAI todavía es “significativa”.