✨︎ Resumen (TL;DR):
- Alibaba presentó Wan2.7-Image para corregir la falta de autenticidad en rostros y colores generados por inteligencia artificial.
- El modelo procesa hasta 3,000 tokens, texto en 12 idiomas y genera documentos complejos con calidad de impresión.
- La herramienta permite la edición precisa a nivel de píxel e impulsa la narrativa visual con hasta 12 imágenes combinadas.
Alibaba presentó este miércoles Wan2.7-Image, un modelo unificado de edición y generación de imágenes diseñado para corregir las deficiencias visuales crónicas de la inteligencia artificial. La herramienta ataca directamente lo que la empresa define como “fatiga estética”, eliminando las caras estandarizadas y los errores en el renderizado de color.
Wan2.7-Image es un modelo visual que procesa imágenes mediante cognición semántica en un espacio latente compartido, en lugar de realizar ajustes superficiales a nivel de píxel. Esta actualización sucede a la serie Wan2.6, lanzada a finales de 2025, la cual destacaba por sus capacidades de referencia a video y salidas mixtas.
El objetivo central de esta versión es generar figuras humanas reales. El sistema permite ajustar la estructura ósea, los ojos y los rasgos faciales para dejar atrás los retratos uniformes y lograr “un rostro único para cada individuo”.
Además, integra una función de paleta. Los usuarios pueden extraer los colores y sus proporciones exactas desde una imagen de referencia para generar nuevos gráficos. Esto resuelve la frustración de los creadores para mantener esquemas de color consistentes en sus proyectos.

Edición milimétrica y renderizado de texto
El modelo soporta la generación de texto en 12 idiomas. Acepta entradas de hasta 3,000 tokens, lo que le permite producir documentos equivalentes a una página A4 entera.
Alibaba afirma que la herramienta renderiza tablas, fórmulas matemáticas y diseños multilingües con “calidad de impresión”.
En el apartado de edición, el software destaca por sus herramientas de intervención directa:
- “Edición de selección precisa” a nivel de píxel para agregar, alinear o mover elementos específicos en áreas determinadas.
- Generación de hasta 12 imágenes combinadas para crear secuencias visuales coherentes.
Junto al modelo base, la empresa lanzó Wan2.7-Image-pro, una variante enfocada en ofrecer mayor precisión de comprensión y estabilidad en la composición de la imagen.
Este lanzamiento intensifica la competencia en el sector del software gráfico, sumándose al debut a principios de año de Qwen-Image 2.0, el otro modelo unificado de Alibaba impulsado por 7 mil millones de parámetros.
