Google anuncia Veo, una IA avanzada de texto a vídeo para competir con Sora

15 May 2024

Google le pisa los talones a OpenAI, ya que solo tres meses después de anunciar su generador de texto a video Sora, el motor de búsqueda y la tecnología lanzaron su propia versión.

En la conferencia anual de desarrolladores de E/S de Google el martes (14 de mayo), veo abierto.

Es el modelo más reciente y avanzado de la generación de video de Google, capaz de producir videos con resolución de 1080p en una variedad de estilos visuales y cinematográficos.

El gigante tecnológico afirma que “Veo se ha basado en años de trabajo en nuestro modelo de vídeo, incluidos Generative Query Network, DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet y Lumiere: nuevas arquitecturas, leyes de escalado y otras técnicas para mejorar la calidad. y salir de la resolución”.

La capacidad de producir vídeos se describe como un “nivel de control creativo sin precedentes”.

Al igual que Sora de OpenAI, el debut de Google aún no está disponible para el público, ya que el equipo solo está trabajando con creadores seleccionados en una vista previa privada con fines de prueba.

Algunas de las capacidades de Veo llegarán a los cortos de YouTube y otros productos en el futuro.

Anuncios de la Conferencia de Desarrolladores de Google – Veo e Imagen 3

Veo no es la única herramienta nueva que Google anunció esta semana, ya que hubo muchas sorpresas en el evento anual.

Junto con el modelo en video, también se reveló la recién lanzada Imagen 3. Es un modelo de texto a imagen que puede crear imágenes fotorrealistas y realistas.

Google dice: “Imagen 3 comprende mejor el lenguaje natural, que incluye la intención detrás de su consulta e incluye pequeños detalles de consultas más largas. La comprensión avanzada del modelo le ayuda a aprender una variedad de estilos”.

Google anuncia Veo, una IA avanzada de texto a vídeo para competir con Sora

Imagen creada por Imagen 3 por encargo: Foto de un hombre de pelo corto y barba sonriendo a la cámara. El fondo está borroso y los edificios tienen colores brillantes.

Nuevamente, el modelo de imagen solo estará disponible para unos pocos elegidos.

A medida que la empresa se centra en la inteligencia artificial, ha publicado detalles sobre sus prácticas responsables para los modelos de vídeo e imagen.

“Trabajamos no sólo en el avance de la tecnología, sino también de manera responsable. Es por eso que estamos tomando medidas para resolver los desafíos que plantean las tecnologías generadas por IA y capacitar a las personas y organizaciones para trabajar con contenido generado por IA”.

Imagen destacada: Foto Kai Wenzel en desempaquetar

Fuente