Live Chat

Crypto News

Cryptocurrency News 7 months ago
ENTRESRUARPTDEFRZHHIIT

OpenAI presenta Sora: un revolucionario modelo de texto a video con capacidades impresionantes

Algoine News
Summary:
OpenAI ha introducido un modelo de texto a vídeo, Sora, que puede convertir simples indicaciones de texto en vídeos detallados de 60 segundos. Utilizando un modelo de "difusión" similar a su predecesor basado en imágenes DALL-E 3, Sora genera un video o imagen inicial que se asemeja al "ruido estático", que refina progresivamente. A pesar de sus capacidades, OpenAI reconoció limitaciones para representar con precisión la física de escenas complejas y comprender las relaciones de causa y efecto. Por ahora, se ha otorgado acceso a Sora a investigadores de ciberseguridad y artistas seleccionados para su evaluación y retroalimentación. Varias demostraciones de las capacidades de Sora han circulado en línea, generando un interés considerable.
OpenAI, un destacado establecimiento de inteligencia artificial, acaba de presentar su novedoso modelo de texto a vídeo, Sora, que, a pesar de las reacciones iniciales positivas, admite que todavía tiene margen de mejora. Sora, anunciado por OpenAI el 15 de febrero, aprovecha las capacidades de la IA para transformar indicaciones de texto sin formato en videos intrincados, mejorar videos preexistentes e incluso crear escenas a partir de una imagen estática. Sora es capaz de producir videos de 60 segundos llenos de ricos detalles, numerosos personajes que exhiben emociones vívidas y movimientos de cámara complejos. En una publicación de blog publicada el 15 de febrero, OpenAI informó que Sora puede construir secuencias similares a una producción cinematográfica en calidades de resolución que alcanzan hasta 1080p. Al igual que el modelo anterior centrado en imágenes de OpenAI, DALL-E 3, Sora ejerce un modelo de "difusión", en el que la IA genera un video o imagen inicial que se asemeja al "ruido estático" y luego lo refina "erradicando el ruido" progresivamente. Según OpenAI, el desarrollo de Sora se basó en los aprendizajes de sus modelos anteriores, GPT y DALL-E3, lo que ha mejorado ostensiblemente la precisión del modelo al reflejar las entradas del usuario. OpenAI reconoció las limitaciones existentes de Sora, como las dificultades para representar correctamente la física de escenas intrincadas y la mala interpretación de las relaciones de causa y efecto. Además, Sora podría malinterpretar y tergiversar los "detalles espaciales" de un mensaje, desalineando así las direcciones o no adhiriéndose a descripciones precisas. Por el momento, OpenAI ha hecho que Sora sea accesible únicamente para los "miembros del equipo rojo", esencialmente investigadores de ciberseguridad, para detectar posibles riesgos y problemas, además de algunos diseñadores, artistas visuales y cineastas seleccionados para proporcionar comentarios para futuras mejoras. Un estudio publicado por la Universidad de Stanford en diciembre de 2023 señaló los dilemas éticos y legales críticos vinculados a los modelos de creación de imágenes o videos que utilizan bases de datos de IA como LAION. Sora ha provocado un gran revuelo en X, con más de 173.000 publicaciones en las que se habla del modelo y se hacen circular demostraciones en vídeo de sus capacidades. El CEO de OpenAI, Sam Altman, demostró su potencial al generar videos personalizados según las solicitudes de los usuarios de X. Varios ejemplos incluyeron un pato con lomo de dragón y golden retrievers que presentaban un podcast desde la cima de una montaña. Varias personas, incluido el comentarista de IA Mckay Wrigley, expresaron su asombro por los videos producidos por Sora. En una publicación fechada el 15 de febrero en X, el investigador principal de Nvidia, Jim Fan, afirmó su creencia de que Sora no es simplemente un juguete de IA como DALL-E 3, sino un "motor de física basado en datos" más evolucionado capaz de renderizado realista, física intuitiva, razonamiento a largo plazo y fundamentación semántica.

Published At

2/16/2024 8:56:53 AM

Disclaimer: Algoine does not endorse any content or product on this page. Readers should conduct their own research before taking any actions related to the asset, company, or any information in this article and assume full responsibility for their decisions. This article should not be considered as investment advice. Our news is prepared with AI support.

Do you suspect this content may be misleading, incomplete, or inappropriate in any way, requiring modification or removal? We appreciate your report.

Report

Fill up form below please

🚀 Algoine is in Public Beta! 🌐 We're working hard to perfect the platform, but please note that unforeseen glitches may arise during the testing stages. Your understanding and patience are appreciated. Explore at your own risk, and thank you for being part of our journey to redefine the Algo-Trading! 💡 #AlgoineBetaLaunch