Google potencia la creatividad con Veo 3.1: video y sonido generados por IA llegan a Flow

La actualización lleva sus capacidades de generación y edición de video a un nuevo nivel dentro de Flow, su entorno experimental para la creación audiovisual con IA

Google vuelve a marcar el ritmo en el campo de la inteligencia artificial aplicada a la creatividad. La compañía presentó Veo 3.1, una actualización que lleva sus capacidades de generación y edición de video a un nuevo nivel dentro de Flow, su entorno experimental para la creación audiovisual con IA.

Hasta ahora, las funciones de Flow permitían generar clips visuales a partir de imágenes o textos. Con Veo 3.1, todas las herramientas ahora incorporan audio: desde Ingredients to Video y Frames to Video hasta Extend.

El resultado es una experiencia más realista, donde la inteligencia artificial genera imágenes y sonidos coherentes entre sí, sincronizados con la acción y la atmósfera del video.



Control creativo total


La nueva versión también refuerza el control narrativo. Los usuarios pueden decidir con precisión cómo se desarrolla una escena, qué elementos incluir o eliminar, y cómo fluye la acción.

Entre las novedades se destacan:
  • Insert: permite agregar objetos o personajes (como animales, vehículos o personas) y la IA ajusta automáticamente iluminación, perspectiva y sombras para integrarlos de forma natural.
  • Remove: elimina elementos no deseados del video, reconstruyendo el fondo de manera imperceptible.

Ambas funciones representan un salto importante hacia una edición más intuitiva y flexible, especialmente útil para creadores, publicistas o desarrolladores que buscan iterar rápido sin perder calidad visual.

Transiciones más naturales y videos extendidos


Veo 3.1 también mejora las transiciones entre imágenes y la extensión de escenas:
  • Frames to Video permite generar un clip completo a partir de dos imágenes (inicio y fin), creando un movimiento fluido entre ambas.
  • Extend hace posible continuar un video existente, ampliando la acción más allá del corte original, incluso durante varios segundos adicionales.

El resultado: narrativas visuales más coherentes y sin interrupciones.

Más fidelidad al prompt y mayor calidad audiovisual


Google asegura que Veo 3.1 ofrece una mejor correspondencia entre las indicaciones del usuario y el resultado final, tanto en imagen como en sonido. Las texturas, los colores y la ambientación logran un nivel de detalle más cercano a la realidad, con videos más estables y consistentes.

Las nuevas funciones ya están disponibles para los usuarios de Flow, y también llegarán a través de la API de Gemini, Vertex AI y la aplicación Gemini. Algunas herramientas —como Add object y Remove object— se irán incorporando gradualmente a la API, mientras que Scene extension debutará próximamente en Vertex AI.

Con Veo 3.1, Google avanza hacia una nueva frontera de la creación audiovisual: una en la que la inteligencia artificial no solo imagina imágenes, sino también las dota de sonido, movimiento y coherencia narrativa. El resultado es un entorno donde la edición se vuelve más natural, colaborativa y expresiva, abriendo nuevas posibilidades para la industria creativa, los estudios de contenido y los desarrolladores de experiencias inmersivas.