En los límites de la realidad: Sora, la IA que crea vídeos hiperrealistas a partir de instrucciones de texto
OpenAI ha presentado una nueva inteligencia artificial capaz de realizar escenas precisas con las indicaciones del usuario
El modelo también puede tomar una imagen fija existente y generar un vídeo a partir de ella
Lo último de lo último: las novedades que traerá el Mobile World Congress 2024
¿Qué es real y qué es puro trampantojo? La inteligencia artificial (IA) sigue empeñada en difuminar los límites que separan lo posible de lo imaginado, con todos los riesgos que eso conlleva en forma de deep fakes, fake news y todo tipo de desinformación. El último peldaño en esta escalera hacia el infinito lo ha dado OpenAI con la presentación de Sora, una IA generativa capaz de crear vídeos hiperrealistas de hasta 60 segundos a partir de simples instrucciones de texto.
MÁS
El procedimiento es espeluznantemente sencillo. El usuario escribe una serie de instrucciones, más o menos detalladas, explicándole a la IA qué características tiene que incluir la escena, así como los personajes y acciones que llevarán a cabo, el entorno, el clima y los movimientos de cámara. Y Sora lo hace. Cualquier cosa que se le pida. Desde mamuts regresando de la extinción hasta un perro haciéndose un selfi.
Una IA capaz de comprender el mundo físico
OpenAI subraya que si el modelo puede realizar escenas tan precisas es porque comprende lo que el usuario solicita en sus indicaciones de texto, pero además es capaz de comprender cómo existen esas cosas en el mundo físico. Bien es cierto que el modelo actual aún tiene defectos. Puede confundir detalles espaciales o no entender del todo ciertas descripciones, pero tiempo al tiempo.
Sora también es capaz de generar un vídeo a partir de una imagen fija existente. Es decir, puede animar una imagen con precisión y sin perder detalle, así como alargar la duración de un vídeo existente o completar algunos fotogramas. Se puede pedir un contenido, un estilo y dar todo tipo de indicaciones. La IA También puede crear varias tomas dentro de un mismo vídeo generado manteniendo con precisión los personajes y el estilo visual.
OpenAI extremará las medidas de seguridad
“Estamos enseñando a la IA a comprender y simular el mundo físico en movimiento, con el objetivo de entrenar modelos que ayuden a las personas a resolver problemas que requieren interacción en el mundo real”, ha explicado OpenAI al presentar la nueva herramienta. Por el momento, el uso del nuevo modelo solo está disponible para los miembros del equipo rojo de la compañía, que se dedica a ponerlo a prueba y comprobar qué fallos presenta y cuáles son sus posibles riesgos.
Antes de lanzarla la empresa se ha comprometido a tomar todas las medidas de seguridad pertinentes. Verificarán y rechazarán todas las solicitudes de ingreso de texto que generen violencia extrema o contenido sexual, utilicen imágenes de odio, fotos de celebrities o la IP de otros usuarios.