Synthesia dévoile une mise à niveau de l’IA permettant aux avatars d’imiter les émotions et les mouvements humains
Summary:
Synthesia, une start-up d’IA soutenue par Nvidia, a lancé « Expressive Avatars », une mise à niveau qui permet aux avatars d’imiter les émotions et les mouvements humains. L’amélioration vise à produire des représentations plus précises des humains, en rectifiant des problèmes tels que les parties du corps déformées. Les nouveaux avatars peuvent répondre à des instructions reflétant les émotions, prendre en charge plus de 130 langues, fournir des sous-titres codés et imiter la voix de l’utilisateur. Synthesia, évaluée à près d’un milliard de dollars, s’adresse à plus de 55 000 entreprises, dont de nombreuses entreprises du Fortune 100.
Synthesia, une société d’intelligence artificielle (IA) soutenue par Nvidia, a dévoilé une mise à niveau innovante qui équipe les avatars de l’IA pour imiter les émotions et les actions humaines. Le 25 avril, l’entreprise a lancé ses « avatars expressifs », conçus pour afficher des sentiments conformes aux commandes textuelles, utilisés principalement pour les présentations d’entreprise, le marketing et les fonctions pédagogiques.
Bien que l’IA générative soit saluée pour sa capacité à fabriquer des graphiques animés convaincants, comme on le voit avec le générateur vidéo Sora d’OpenAI, elle est encore loin d’être parfaite, en particulier lorsqu’il s’agit d’émuler des humains, ce qui entraîne souvent des parties du corps déformées, des arrière-plans dépareillés ou des mouvements de lèvres non coordonnés avec la parole. Synthesia cherche à rectifier ces inexactitudes dans sa version la plus récente, développée à l’aide de personnes réelles lisant des scripts. Cette approche aide les robots à perfectionner la précision des mouvements des lèvres et à affiner leur représentation émotionnelle. Le PDG et cofondateur de Synthesia, Victor Ribarbelli, a souligné dans une vidéo que, contrairement aux humains, les avatars manquaient auparavant de compréhension de leur discours, ce qui les privait de réactions faciales appropriées.
L’entraînement en studio impliquait que les avatars répondent avec succès à des directives de base telles que « Je suis heureux. Je suis triste. Je suis frustré », ce qui entraîne une reproduction précise des indices faciaux et de l’intonation associés. Les nouveaux avatars de la société prennent en charge plus de 130 langues, offrent un sous-titrage automatique et peuvent dupliquer la voix d’un utilisateur. Le modèle de langue anglaise s’avère être le plus réaliste et le plus sophistiqué parmi les autres modèles de langue basés sur un test de Cointelegraph.
Synthesia, qui compte parmi ses clients au moins la moitié des entreprises du classement Fortune 100, s’adresse à plus de 55 000 entreprises, dont des leaders du marché comme Zoom, Xerox, Microsoft et Reuters, pour n’en nommer que quelques-unes. Fondée en 2017 au Royaume-Uni, la société a atteint une valorisation de près d’un milliard de dollars, grâce à la récente poussée de l’IA et au soutien d’acteurs importants comme Nvidia, qui est à la pointe de l’innovation en matière de puces à semi-conducteurs pour l’IA. Avec sa mission ciblée de concevoir des avatars réalistes pour des applications commerciales, Synthesia a réussi à contourner une partie de la rivalité surchauffée observée dans l’espace des chatbots, où des modèles comme ChatGPT d’OpenAI et le chatbot Gemini de Google sont en tête-à-tête.
Published At
4/26/2024 2:51:52 PM
Disclaimer: Algoine does not endorse any content or product on this page. Readers should conduct their own research before taking any actions related to the asset, company, or any information in this article and assume full responsibility for their decisions. This article should not be considered as investment advice. Our news is prepared with AI support.
Do you suspect this content may be misleading, incomplete, or inappropriate in any way, requiring modification or removal?
We appreciate your report.