Mi experiencia como cineasta que ha probado Sora, la IA de OpenAI para crear vídeos

| Traducido por: 
Vídeo "Abstract" de Paul Trillo con Sora de OpenAI.
Vídeo "Abstract" de Paul Trillo con Sora de OpenAI.

OpenAI

  • OpenAI ha revolucionado Hollywood con la presentación de Sora, una herramienta capaz de convertir texto en vídeos de alta calidad.
  • Paul Trillo, un cineasta que ha puesto a prueba Sora, detalla su experiencia, sus capacidades y sus limitaciones.

Este artículo se basa en una conversación con Paul Trillo, artista y cineasta residente en Los Ángeles cuya experimentación con Sora de OpenAI ha producido vídeos como "Abstract" y "The Golden Record". El siguiente texto ha sido editado por razones de extensión y claridad.

Llevo probando Sora desde finales de febrero. Me interesaba tratar de encontrar ideas y efectos visuales que hubieran sido más difíciles o extraños de explorar de forma tradicional. Así que estoy haciendo un vídeo musical que tiene una lógica onírica y que transcurre a lo largo de varias décadas, y estamos mezclando entornos. Es una idea que tuve hace unos diez años, pero que nunca pude llevar a cabo porque era demasiado ambiciosa.

Todas las ideas de Sora pasan por múltiples iteraciones. Muchas de las cosas que he estado haciendo tratan de conseguir movimientos de cámara específicos, tanto guiados o dinámicos como estéticos. Así que veo si puedo crear el tema que estoy pidiendo, y en realidad no lo entiende todo. A veces mezcla ideas y mezcla lo que le pides.

Luego tengo un cóctel de palabras que utilizo para asegurarme de que parezca menos un videojuego y algo más cinematográfico. Pero incluso ciertas palabras acaban haciendo que las cosas parezcan más un videojuego. Así que combinas ciertas palabras con otras para intentar conseguir la estética que quieres. Yo descarto "35 milímetros", descarto "lente anamórfica", "viñeta de lente de profundidad de campo", "película Fuji", "analógica de stock". Si no pones nada, se convertirá por defecto en algo muy digital.

Uno de los prompts para The Golden Record empezaba así: "En una película analógica de ambiente sombrío, hacemos zoom en un paisaje volátil de meteoritos rocosos de la Tierra en su estado más crudo, vemos un disco dorado que se eleva a través de las oscuras profundidades del espacio, rocas surrealistas flotantes y humo llenando el ambiente. La escena es caótica y primitiva, con el poder destructivo de la naturaleza desatado". (Desplázate hasta el final si quieres leer el texto completo).

Todo tiene que tener su visto bueno antes de salir a la luz. Hay muchas precauciones: no hay desnudos, ni violencia, ni imágenes, ni nada que esté protegido por derechos de autor. Algunas son demasiado protectoras. A los probadores de la versión alfa nos resulta incluso confuso saber qué límites se están poniendo. Pero aún se puede hacer mucho con ella. Me permite probar idea sin poner nada en riesgo. Es increíblemente liberadora.

Paul Trillo
Paul Trillo

Paul Trillo

Mucha gente del mundo de la publicidad me pregunta: "Oye, ¿cómo puedo entrar en Sora?". Ese es probablemente el caso de uso más aburrido para esta increíble tecnología: utilizarse en un anuncio como sustituto de algo que se podría hacer de otra manera.

Sora está lejos de estar lista para Hollywood

Desde el punto de vista del valor de producción y la calidad, todavía estamos lejos de se utilice en películas. Tienen mejor poder computación, pero aún no tienen suficiente para dar servicio a toneladas de usuarios. Todavía existe un gran componente de que se trate de una máquina tragaperras en la que pides algo y se mezclan ideas, y no tiene un motor de física real. Es sólo una especie de espejo reflejo de lo que está viendo. Todavía queda mucho camino por recorrer para crear un personaje coherente. 

Tal vez dentro de 10 años, realmente podría hacer la diferencia en la vida de alguien que no tiene recursos. Pero a la gente le va a parecer que la experiencia de usar esto no es tan emocionante como la de estar en el set de rodaje con gente real. Lo que hace del cine un campo único es el aspecto colaborativo que no puede crearse en una experiencia aislada, hablando con una máquina.

Sora podría reducir el coste de hacer cine

Me entusiasman los casos de uso más experimentales, pero sin duda hay un componente de ahorro de dinero. Las películas son increíblemente caras. También son increíblemente derrochadoras e ineficientes. Así que no creo que sea malo intentar que el proceso sea más eficiente. Ese es quizá el aspecto que la gente echa de menos tras las huelgas. Los estudios han sido muy claros al decir que ahora van a dar luz verde a menos proyectos porque tienen que poner más guionistas en la sala de guionistas. Tienen que desembolsar más dinero en concepto de pagos remanentes (los llamados residuals). Si esto puede crear canales para que se hagan cosas que de otro modo no habrían recibido luz verde y que realmente podamos empezar a producir más, no lo veo realmente como algo malo.

Creo que la posproducción es lo que más va a cambiar. Muchas películas independientes no pueden permitirse el lujo de tener nada de posproducción. Si esto iguala las condiciones para que las películas independientes puedan soñar un poco más y llegar un poco más alto, en última instancia será algo positivo.

Sora lleva la delantera ahora, pero con el tiempo habrá una versión de código abierto de esto que no estará hecha por OpenAI. Es probable que Stable Diffusion se ponga al día en algún momento. Me lo imagino sustituyendo algunos aspectos de las tomas secundarias y de inserción, o las tomas de apoyo, o cualquier material de archivo. Como director, quieres pasar el mayor tiempo posible trabajando con los actores. No quieres emplear tu tiempo en esas tomas intercaladas que no son tan importantes para la historia. Además, el material de archivo es muy limitado y estéticamente no siempre encaja.

Netflix

Sora sigue siendo un proyecto de investigación en fase alfa

OpenAI no tiene una línea temporal establecida. Y es un poco confuso saber cuál va a ser el mercado al que se dirigirá. Espero que no lo simplifiquen, porque la herramienta es más compleja de lo que la gente cree, pero hay que manejarla, y creo que sería un flaco favor convertirla en una especie de fábrica de creación de contenidos. Espero que esto vaya por el camino más sofisticado. Puede que haya más dinero en Hollywood, pero van a tener que hacer mucho más para dar servicio a esa clientela de gama realmente alta.

Intento encontrar el punto medio entre jugar con una tecnología mágica que sólo puede surgir gracias a estas empresas tecnológicas y tranquilizar a los cineastas diciéndoles que es un buen momento para ser cineasta, porque se pueden concebir ideas que nunca habíamos podido hacer. Por eso estoy hablando con todas estas empresas: para asegurarme de que saben para qué están haciendo estas herramientas. Me preocupa el uso excesivo de la IA y lo que va a suponer en cuanto a habilidades, creatividad y cultura. Además, creo que de todos, ese es el uso más aburrido de la IA.

Aquí está el texto completo de "El disco de oro" (saltos de párrafo añadidos):

Película analógica de ambiente sombrío que nos acerca a un paisaje volátil de meteoritos rocosos de la tierra en su estado más crudo, con un disco dorado que se eleva a través de las oscuras profundidades del espacio, rocas surrealistas flotantes y humo llenando todo el ambiente. La escena es caótica y primitiva, con el poder destructivo de la naturaleza desatado.

La escena está captada desde una perspectiva de zoom rápido, como si el espectador estuviera volando por los aires y observando la escena desde arriba. Suave luz solar natural, la toma es borrosa y distorsionada, con un stock de grano de película fuji de 35 mm. analógica. Desenfoque de movimiento y textura fílmica, luz orgánica del sol en el espacio, NASA, lente anamórfica, tono vintage, textura de grano de película.

La escena pasa del paisaje rocoso a un disco dorado que se precipita volando por el aire en un vacío rocoso, su cuerpo empieza a derretirse. El espectador puede ver un movimiento borroso mientras el hombre que se derrite pasa corriendo, la escena está captada desde una perspectiva de zoom rápido, el espectador sale del disco dorado que se precipita y entra en un campo de rocas flotantes. La escena está llena de rocas flotantes y voladoras surrealistas.

El disco de oro cae y da vueltas y gira a través de la oscuridad del espacio, la escena pasa del campo de rocas flotantes a la mano abierta hecha de fragmentos de oro pertenecientes a un nebuloso líquido translúcido iridiscente dios alienígena con apariencia de medusa y zarcillos que se extienden por el espacio, el oro se funde, el disco circular de oro da volteretas y vuela y gira por el aire, el espectador puede ver el disco de oro abrirse, como si estuviera haciendo zoom a través de la mano de cristal y observando la escena desde abajo.

La escena se transforma en una vasta extensión de espacio en la que el disco dorado gira y vuela dinámicamente. Seguimos la acción mientras una medusa translúcida interactúa con el disco dorado, inundado de ríos iridiscentes, y el disco dorado se eleva a través de una explosión de polvo y humo de cohetes. El espectador puede ver la ciudad desde un ángulo elevado, como si sobrevolara las calles y observara la escena desde arriba.

Volamos hacia un ángulo bajo del río iridiscente, la toma es borrosa y distorsionada, con un efecto de grano de película de 35 mm. Desenfoque de movimiento y textura fílmica. La escena hace una transición y emerge por el lado de un disco dorado que vuela en el aire, órganos biorgánicos nebulus. líquido de medusa translúcida iridiscente del dios alienígena con zarcillos se extiende por el espacio, el disco dorado derritiéndose hecho de disco dorado iridiscente vuela hacia el espacio exterior, hacia la distancia. La toma es clara y nítida

Axel Springer, la empresa matriz de Business Insider, tiene un acuerdo global para permitir que OpenAI entrene sus modelos en los reportajes de sus marcas de medios.

Conoce cómo trabajamos en Business Insider.