Synthesia svela l'aggiornamento dell'intelligenza artificiale che consente agli avatar di imitare le emozioni e i movimenti umani
Summary:
Synthesia, una startup di intelligenza artificiale sostenuta da Nvidia, ha lanciato "Expressive Avatars", un aggiornamento che consente agli avatar di imitare le emozioni e i movimenti umani. Il miglioramento mira a produrre rappresentazioni più accurate degli esseri umani, correggendo problemi come le parti del corpo distorte. I nuovi avatar possono rispondere alle istruzioni che riflettono le emozioni, supportare oltre 130 lingue, fornire sottotitoli e imitare le voci degli utenti. Synthesia, del valore di quasi 1 miliardo di dollari, si rivolge a più di 55.000 aziende, tra cui molte aziende Fortune 100.
Synthesia, una società di intelligenza artificiale (AI) sostenuta da Nvidia, ha presentato un aggiornamento innovativo che equipaggia gli avatar AI per imitare le emozioni e le azioni umane. Il 25 aprile, l'azienda ha lanciato i suoi "Avatar espressivi", progettati per visualizzare i sentimenti in linea con i comandi di testo, utilizzati principalmente per presentazioni aziendali, marketing e funzioni didattiche.
Nonostante l'IA generativa sia acclamata per la sua capacità di fabbricare grafica animata convincente, come si è visto con il generatore video Sora di OpenAI, è ancora lontana dall'essere perfetta, in particolare quando si tratta di emulare gli esseri umani, spesso con conseguenti parti del corpo distorte, sfondi non corrispondenti o movimenti delle labbra non coordinati con il parlato. Synthesia cerca di correggere queste inesattezze nella sua iterazione più recente sviluppata utilizzando persone reali che leggono copioni. Questo approccio aiuta i robot a perfezionare l'accuratezza del movimento delle labbra e a perfezionare la loro rappresentazione emotiva. Il CEO e co-fondatore di Synthesia, Victor Ribarbelli, ha evidenziato in un video che, a differenza degli esseri umani, gli avatar in precedenza mancavano di comprensione del loro discorso, privandoli di reazioni facciali appropriate.
L'addestramento in studio prevedeva che gli avatar rispondessero con successo a direttive di base come "Sono felice. Sono triste. Sono frustrato", con conseguente replica accurata dei segnali facciali e dell'intonazione associati. I nuovi avatar dell'azienda supportano oltre 130 lingue, offrono sottotitoli automatici e possono duplicare la voce di un utente. Il modello linguistico inglese si è dimostrato il più realistico e sofisticato tra gli altri modelli linguistici basati su un test di Cointelegraph.
Synthesia, quotata con almeno la metà delle aziende Fortune 100 come clienti, si rivolge a più di 55.000 aziende, tra cui leader di mercato come Zoom, Xerox, Microsoft e Reuters, solo per citarne alcune. Fondata nel 2017 nel Regno Unito, l'azienda ha raggiunto una valutazione di quasi 1 miliardo di dollari, trainata dalla recente impennata dell'intelligenza artificiale e dal sostegno di attori significativi come Nvidia che guidano l'innovazione dei chip semiconduttori AI. Con la sua missione mirata di ideare avatar realistici per applicazioni commerciali, Synthesia è riuscita ad aggirare parte della rivalità surriscaldata vista nello spazio dei chatbot, dove modelli come ChatGPT di OpenAI e il chatbot Gemini di Google sono testa a testa.
Published At
4/26/2024 2:51:52 PM
Disclaimer: Algoine does not endorse any content or product on this page. Readers should conduct their own research before taking any actions related to the asset, company, or any information in this article and assume full responsibility for their decisions. This article should not be considered as investment advice. Our news is prepared with AI support.
Do you suspect this content may be misleading, incomplete, or inappropriate in any way, requiring modification or removal?
We appreciate your report.