Google lanza Gemini Omni: su nueva IA generativa de video

Google lanza Gemini Omni en I/O 2026, su nueva IA de video con edición conversacional y marca de agua SynthID.

Por Humberto Toledo el 20 de mayo del 2026 a las 12:26 am PDT

Resume con:

✨︎ Resumen (TL;DR):

Google presentó Gemini Omni, una familia de modelos de IA enfocada en la creación y edición de video con audio.

La versión Flash genera clips de hasta 10 segundos y permite modificar detalles mediante comandos de conversación.

Todos los videos generados contarán con la marca de agua invisible SynthID para certificar su origen artificial.

Google presentó este martes en su conferencia I/O 2026 a Gemini Omni, una nueva familia de modelos de inteligencia artificial generativa diseñada para producir y editar videos con audio integrado a partir de texto, imágenes y grabaciones previas [firstpost.com, mashable.com]. Esta herramienta busca superar las capacidades de los sistemas tradicionales al permitir que los usuarios modifiquen el contenido mediante instrucciones habladas o escritas [theverge.com].

Durante la conferencia principal en el Shoreline Amphitheatre en Mountain View, California, el CEO de Google DeepMind, Demis Hassabis, describió a Omni como un paso hacia un sistema capaz de “crear cualquier cosa a partir de cualquier entrada” [theverge.com].

La primera versión disponible de esta tecnología es Gemini Omni Flash, un modelo capaz de generar clips de hasta 10 segundos que combinan imagen y sonido [theverge.com]. A diferencia de otras herramientas previas de la compañía, como Veo, este sistema utiliza videos existentes como base para crear nuevas escenas y permite realizar ediciones de forma conversacional [theverge.com].

Te podría interesar:
Demis Hassabis: la humanidad está en las faldas de la singularidad

Fotos de stock gratuitas de aparatos de musica, aplicación de música, auriculares — Foto: Egor Komarov / Pexels

Edición conversacional y física más precisa

Gemini Omni Flash es un modelo de inteligencia artificial que genera y edita clips de video con audio a través de comandos interactivos. Con esta herramienta, las personas pueden alterar fondos, cambiar ángulos de cámara, modificar escenarios o redefinir detalles específicos dentro de una toma ya grabada o generada [theverge.com].

De acuerdo con Dumitru Erhan, director de investigación en Google DeepMind, el modelo aprovecha el conocimiento del mundo real de Gemini para ofrecer una mayor precisión en las leyes de la física y comprender el contexto cultural o histórico de las instrucciones recibidas [theverge.com].

El despliegue de Gemini Omni Flash comenzó este martes para los suscriptores de los planes Google AI Plus, Pro y Ultra dentro de la aplicación de Gemini y la plataforma Google Flow [mashable.com]. Además, llegará de forma gratuita a YouTube Shorts y a la aplicación YouTube Create en el transcurso de esta semana [mashable.com].

Precios ajustados y seguridad digital

Google aprovechó el evento para reestructurar las tarifas de su plan premium [theverge.com]. El paquete AI Ultra ahora inicia en 100 dólares mensuales con límites de uso más altos, mientras que el nivel anterior de 250 dólares disminuyó a 200 dólares [theverge.com].

Para combatir la desinformación, cada archivo generado por Omni incluirá la marca de agua invisible SynthID de Google DeepMind [engadget.com]. La compañía también anunció que expandirá la detección de esta marca a Chrome y Google Search, lo que facilitará que herramientas como Lens y Circle to Search identifiquen imágenes creadas artificialmente [engadget.com].

Finalmente, firmas como OpenAI, Nvidia, Kakao y ElevenLabs se comprometieron a adoptar la tecnología SynthID en sus propios desarrollos de contenido generativo, aunque aún no definen una fecha exacta para su implementación [theverge.com].

Fuentes: 1, 2, 3, 4, 5