Google desarrolla inteligencia artificial para generar videos guiados por textos cortos

Listen to this article

Imagen Video genera videos de alta calidad y tiene «un alto grado de controlabilidad y conocimiento del mundo»

Con la publicación de un estudio, Google anunció el desarrollo de Imagen Video, un sistema que utiliza inteligencia artificial para producir videos a partir de textos escritos. Así, la herramienta crea un corto animado empleando un modelo base de generación de videos y una secuencia de modelos de video en alta definición.

Similar a otros sistemas como DALL·E 2, Imagen Video toma las descripciones cortas que un usuario escribe para convertirlas en un video relacionado de manera instantánea usando herramientas de inteligencia artificial (IA).

«Encontramos que Imagen Video no solo es capaz de generar videos de alta fidelidad, sino que también tiene un alto grado de controlabilidad y conocimiento del mundo, incluida la capacidad de generar diversos videos y animaciones de texto en varios estilos artísticos y con comprensión de objetos 3D», cita la investigación publicada por Google.

¿Cómo se creó?

Google afirma haber entrenado el sistema con una base de datos de 14 millones de parejas de video y texto y 60 millones de parejas de imagen y texto, así como la consulta a la base de datos LAION, que contiene 400 millones de parejas de imagen y texto. 

«Para procesar los datos de una forma adecuada que permita entrenar nuestra canalización en cascada, cambiamos el tamaño espacial de las imágenes y los videos… y el tamaño de los videos temporalmente omitiendo fotogramas», se lee en el estudio.

Dentro de sus hallazgos, Google indica que Imagen Video es capaz de generar videos de alta fidelidad. Además, la herramienta posee varias capacidades únicas que tradicionalmente no se encuentran en modelos generativos no estructurados aprendidos puramente de datos. 

En ese sentido, hay imágenes que demuestran que el modelo de Google puede generar videos con estilos artísticos aprendidos de la información de la imagen, como videos al estilo de las pinturas de van Gogh o las acuarelas.

Cabe resaltar que los videos generados tienen una resolución de 1,280 x 768 píxeles, una frecuencia de 24 fotogramas por segundo y una duración de 5.3 segundos.

Imagen: tecnología para generar imágenes con IA

En 2022, Google anunció a Imagen, su sistema de generación de imágenes a partir de texto gracias a herramientas de IA. Este modelo permite crear imágenes hiperrealistas 1,024 x 1,024 pixeles a partir de breves descripciones.

Si bien Imagen e Imagen Video no están disponibles de manera abierta al público, sus resultados y creaciones pueden ser vistas en este link.

Deja un comentario

Descubre más desde InfoNoticiasPerú

Suscríbete ahora para seguir leyendo y obtener acceso al archivo completo.

Seguir leyendo