Olvida el texto en la imagen; esta IA crea videos a partir de tus sugerencias

Probablemente haya oído hablar de los increíbles logros de la IA de texto a imagen como Dall-E, Stable Diffusion y Midjourney. Como era de esperar, la revolución avanza y el próximo objetivo son las herramientas de inteligencia artificial de texto a video.

Google y Meta se han burlado de sus capacidades de texto a video en informes de investigación de sus laboratorios de inteligencia artificial, pero esta tecnología avanzada no ha estado disponible públicamente. Si ha estado esperando ansiosamente la oportunidad de intentar crear videos completos con una simple sugerencia de IA, ahora es su oportunidad, gracias a QuickVid.

Antes de que sus expectativas sean demasiado altas, es importante darse cuenta de que esto no es lo mismo que generar miles de imágenes fijas de difusión estable y ensamblarlas para crear un video u obtener acceso a los sistemas de IA más avanzados del mundo para una generación real de videos. Esta es una entrada muy temprana en la carrera por una solución de texto a video.

El primer paso del proceso de IA es generar un script basado en su aviso. Probé el sistema creando un corto de YouTube con estas palabras: “Un video de un dron DJI volando junto a un astronauta en Marte, que termina con una toma de reacción del astronauta sorprendido”.

La IA escribió una narración completa de 79 palabras a partir de mi sugerencia, luego sintetizó el discurso en una elección de voz masculina o femenina. TechCrunch señaló que el video de fondo elegido para el video generado es de una biblioteca de archivos y aparentemente había muchas imágenes de “astronautas en Marte”.

Como toque final cuestionable, QuickVid superpone el guión como títulos y agrega imágenes en miniatura generadas por la API de Dall-E. El corto resultante de YouTube visto arriba es… interesante. Tal vez, manejaría mejor los videos más mundanos.

En una entrevista con TechCrunch, el desarrollador de QuickVid dijo que las mejoras están en camino y que llegarán más opciones de personalización en enero. Eventualmente, QuickVid también incluirá subtítulos y avatares de apoyo.

Muchas más soluciones de texto a video podrían llegar el próximo año, junto con otras maravillas visuales como gafas AR y auriculares VR más avanzados. Debería ser emocionante.

Recomendaciones del editor

Compruebe también

La actualización Wear OS de Google Wallet convierte tu muñeca en una útil llave de habitación

Lo que necesitas saber Google está lanzando una actualización hoy (3 de diciembre) que permite …

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *