Live Chat

Crypto News

Cryptocurrency News 7 months ago
ENTRESRUARPTDEFRZHHIIT

OpenAI presenta Sora: un rivoluzionario modello text-to-video con capacità impressionanti

Algoine News
Summary:
OpenAI ha introdotto un modello text-to-video, Sora, in grado di convertire semplici prompt di testo in video dettagliati di 60 secondi. Utilizzando un modello di "diffusione" simile al suo predecessore basato su immagini DALL-E 3, Sora genera un video o un'immagine iniziale simile al "rumore statico", che perfeziona progressivamente. Nonostante le sue capacità, OpenAI ha riconosciuto i limiti nella rappresentazione accurata della fisica di scene complesse e nella comprensione delle relazioni causa-effetto. Per ora, l'accesso a Sora è stato concesso a ricercatori di sicurezza informatica e artisti selezionati per la valutazione e il feedback. Diverse dimostrazioni delle capacità di Sora sono circolate online, suscitando un notevole interesse.
OpenAI, un'importante istituzione di intelligenza artificiale, ha appena introdotto il suo nuovo modello text-to-video, Sora, che, nonostante le reazioni iniziali positive, ha ancora spazio per miglioramenti. Sora, annunciato da OpenAI il 15 febbraio, sfrutta le capacità dell'intelligenza artificiale per trasformare i prompt di testo normale in video intricati, migliorare i video preesistenti e persino creare scene da un'immagine statica. Sora è in grado di produrre video di 60 secondi ricchi di dettagli, numerosi personaggi che mostrano emozioni vivide e movimenti di macchina complessi. In un post sul blog pubblicato il 15 febbraio, OpenAI ha riferito che Sora è in grado di costruire sequenze simili a una produzione cinematografica con una risoluzione che arriva fino a 1080p. Simile al precedente modello incentrato sull'immagine di OpenAI, DALL-E 3, Sora esercita un modello di "diffusione", in cui l'IA genera un video o un'immagine iniziale che assomiglia al "rumore statico" e poi lo perfeziona "sradicando il rumore" progressivamente. Secondo OpenAI, lo sviluppo di Sora si è basato su quanto appreso dai loro modelli precedenti, GPT e DALL-E3, che hanno apparentemente migliorato l'accuratezza del modello nel rispecchiare gli input dell'utente. OpenAI ha riconosciuto i limiti esistenti di Sora, come le difficoltà nel rappresentare correttamente la fisica di scene intricate e l'errata interpretazione delle relazioni di causa ed effetto. Inoltre, Sora potrebbe fraintendere e travisare le "specifiche spaziali" di un prompt, disallineando così le direzioni o non aderendo a descrizioni precise. Per il momento, OpenAI ha reso Sora accessibile esclusivamente ai "red teamer", essenzialmente ricercatori di sicurezza informatica, per individuare possibili rischi e problemi, oltre ad alcuni designer, artisti visivi e registi selezionati per fornire feedback per ulteriori miglioramenti. Uno studio pubblicato dalla Stanford University nel dicembre 2023 ha evidenziato i dilemmi etici e legali critici legati ai modelli di creazione di immagini o video che utilizzano database di intelligenza artificiale come LAION. Sora ha suscitato scalpore su X, con oltre 173.000 post che discutono del modello e fanno circolare dimostrazioni video delle sue capacità. Il CEO di OpenAI, Sam Altman, ha dimostrato il suo potenziale generando video personalizzati secondo le richieste degli utenti di X. Vari esempi includevano un'anatra dal dorso di drago e golden retriever che ospitavano un podcast dalla cima di una montagna. Diverse persone, tra cui il commentatore di intelligenza artificiale Mckay Wrigley, hanno espresso il loro stupore per i video prodotti da Sora. In un post datato 15 febbraio su X, il ricercatore senior di Nvidia, Jim Fan, ha affermato la sua convinzione che Sora non sia semplicemente un giocattolo AI come DALL-E 3, ma un più evoluto "motore fisico basato sui dati" in grado di rendere realistico, fisica intuitiva, ragionamento a lungo termine e basi semantiche.

Published At

2/16/2024 8:56:53 AM

Disclaimer: Algoine does not endorse any content or product on this page. Readers should conduct their own research before taking any actions related to the asset, company, or any information in this article and assume full responsibility for their decisions. This article should not be considered as investment advice. Our news is prepared with AI support.

Do you suspect this content may be misleading, incomplete, or inappropriate in any way, requiring modification or removal? We appreciate your report.

Report

Fill up form below please

🚀 Algoine is in Public Beta! 🌐 We're working hard to perfect the platform, but please note that unforeseen glitches may arise during the testing stages. Your understanding and patience are appreciated. Explore at your own risk, and thank you for being part of our journey to redefine the Algo-Trading! 💡 #AlgoineBetaLaunch