Tecnología

OpenAI presenta Sora, un avanzado modelo de generación de videos a partir de texto

Published February 15, 2024

OpenAI anunció el jueves el lanzamiento de Sora, un modelo innovador capaz de crear videos en alta definición de hasta un minuto de duración a partir de simples instrucciones textuales. El nombre Sora, que significa 'cielo' en japonés, ha sido escogido para representar esta novedosa tecnología que, por el momento, no estará accesible para el gran público. En su lugar, OpenAI optará por ofrecer acceso exclusivo a un selecto grupo de académicos e investigadores con el objetivo de evaluar los posibles riesgos y el potencial para un uso indebido del modelo.

Capacidades del Modelo Sora

Según OpenAI, Sora es capaz de generar escenas complejas que incluyen múltiples personajes, movimientos específicos y detalles precisos tanto en el sujeto como en el fondo. Este modelo entiende no solo la solicitud textual del usuario, sino también cómo los elementos solicitados interactúan en el mundo real. Por ejemplo, un video demostrativo muestra a una pareja caminando bajo la nieve en un Tokio decorado por pétalos de cerezo.

Otro video enseña mamuts peludos caminando realísticamente a través de una pradera nevada con montañas nevadas al fondo. OpenAI señaló que su modelo opera gracias a una 'profunda comprensión del lenguaje', lo que le permite interpretar con exactitud las instrucciones textuales. Sin embargo, a pesar de su avanzada tecnología, Sora aún podría tener algunos errores, como omitir ciertos elementos de una escena.

Único en su Capacidad de Video

A pesar de que existen otros modelos de texto a video creados por empresas como Meta, Google y Runway, Sora destaca por ser capaz de generar videos de hasta 60 segundos de manera continua, sin la necesidad de ensamblarlos cuadro por cuadro. Esto asegura la consistencia visual de los sujetos, incluso si salen temporalmente del campo de visión.

Cuestiones Éticas y de Seguridad

La proliferación de herramientas de texto a video ha generado preocupaciones sobre la facilidad para crear material falso de apariencia realista. Expertos temen que estas tecnologías puedan influir en eventos críticos como elecciones. Asimismo, profesionales creativos expresan inquietud sobre la posibilidad de que la IA genere contenido que suplante empleos humanos. En respuesta, OpenAI trabaja con especialistas para probar la herramienta y desarrollar métodos que permitan detectar los videos creados por Sora. La compañía incluirá metadatos en los videos generados para facilitar su identificación, aunque no ha divulgado detalles sobre el entrenamiento del modelo más allá de mencionar el uso de videos públicos y con licencia.

OpenAI, Sora, video