Tecnología

Veo de Google, el avanzado generador de texto a video que desafía a OpenAI

Published May 15, 2024

En el mundo de la inteligencia artificial, la generación de imágenes ha sido una sensación en 2023, pero ahora la atención se dirige hacia una nueva frontera: la generación de vídeos mediante IA. Con el lanzamiento del generador de textos a vídeos Sora por parte de OpenAI en febrero de 2024, se esperaba que Google presentara una contraparte compitiendo en innovación.

Google presenta Veo

El martes, durante su conferencia anual de desarrolladores Google I/O, Google presentó Veo, su generador de texto a video más avanzado hasta la fecha. Capaz de generar vídeos de 1080p de resolución y con duración de más de un minuto, Veo marca un nuevo hito para la compañía.

Google destaca que Veo ofrece 'un nivel sin precedentes de control creativo' a los usuarios. Gracias a su profundo entendimiento del lenguaje natural, Veo puede procesar descripciones más extensas y comprender términos cinematográficos como 'timelapse' o 'tomas aéreas'.

Calidad y fluidez en la generación de videos

Veo también aborda problemas comunes en la generación de vídeos, como la fluidez de las escenas. Según Google, su generador puede crear metrajes consistentes con sujeto moviéndose de manera realista.

Este modelo no es el primer intento de Google en generación de vídeo. La compañía hizo hincapié en que Veo está construido sobre proyectos previos como Imagen-Video, VideoPoet y Lumiere.

Veo en fase de vista previa

Aunque Veo, al igual que Sora de OpenAI, no está aún disponible para el público en general. Por el momento, Google está ofreciendo una vista previa privada de Veo a creadores seleccionados a través de VideoFX, aunque también ha habilitado una lista de espera para aquellos interesados en probar el modelo.

Además, Google anunció Imagen 3, su modelo de texto a imagen más avanzado, que también se encuentra en vista previa privada con una lista de espera.

IA, Veo, Google