sora

OpenAI presenta el nuevo generador de texto a video Sora

Open AI está implementando Sora, su nueva IA de texto a video.

Open AI, la compañía detrás de ChatGPT, está implementando su modelo de texto a video que generará videos de hasta un minuto de duración basándose únicamente en la entrada de texto.

El producto, Sora, se encuentra actualmente en pruebas iniciales con un grupo selecto de usuarios y artistas. Este lanzamiento llega inmediatamente después de Make-a-Video, desarrollado por Meta, matriz de Facebook. El producto de Meta se presentó en octubre de 2022, pero no se lanzó al público. Actualmente hay otros generadores de texto a video en el mercado. Sin embargo, si Sora se extiende a un lanzamiento amplio, estaría entre los primeros actores importantes en productos de video AI para consumidores.

Estamos enseñando a la IA a comprender y simular el mundo físico en movimiento, con el objetivo de entrenar modelos que ayuden a las personas a resolver problemas que requieren interacción en el mundo real.

Así lo explicaba OpenAI en un comunicado en el sitio web de Sora. La compañía también ha publicado un whitepaper sobre su desarrollo. Actualmente, OpenAI está buscando comentarios de un puñado de artistas visuales, diseñadores y cineastas sobre cómo Sora puede ser más útil y útil para los artistas creativos.

Aun en fase de prueba

La compañía utilizará la investigación que obtenga de los primeros usuarios para decirle al público de qué es capaz Sora y qué capacidades de IA hay en el horizonte.

Sora es capaz de generar escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos del tema y el fondo. El modelo comprende no sólo lo que el usuario ha pedido en el mensaje, sino también cómo existen esas cosas en el mundo físico.

OpenAI dijo que Sora tiene un profundo conocimiento del lenguaje, lo que le permite interpretar indicaciones y generar personajes que expresan emociones reales. Los matices serán un sello distintivo de la nueva versión del software, superando las debilidades existentes al simular los detalles de una escena compleja y comprender la causa y el efecto.

“Por ejemplo, una persona puede darle un mordisco a una galleta, pero después, es posible que la galleta no tenga la marca del mordisco”, dijo OpenAI.

“El modelo también puede confundir los detalles espaciales de un mensaje, por ejemplo, mezclando izquierda y derecha, y puede tener dificultades con descripciones precisas de eventos que tienen lugar a lo largo del tiempo, como seguir una trayectoria de cámara específica”.

La compañía dijo que está haciendo de la seguridad un sello distintivo del nuevo sistema, protegiéndolo contra la desinformación, los prejuicios y el contenido de odio, a los que otros fabricantes de IA también se han enfrentado.