Synthesia enthüllt KI-Upgrade, mit dem Avatare menschliche Emotionen und Bewegungen nachahmen können
Summary:
Synthesia, ein KI-Startup, das von Nvidia unterstützt wird, hat "Expressive Avatars" auf den Markt gebracht, ein Upgrade, das es Avataren ermöglicht, menschliche Emotionen und Bewegungen nachzuahmen. Die Verbesserung zielt darauf ab, genauere Darstellungen von Menschen zu erstellen und Probleme wie verzerrte Körperteile zu beheben. Die neuen Avatare können auf Anweisungen reagieren, die Emotionen widerspiegeln, über 130 Sprachen unterstützen, Untertitel bereitstellen und die Stimmen der Benutzer nachahmen. Synthesia wird mit fast 1 Milliarde US-Dollar bewertet und bedient mehr als 55.000 Unternehmen, darunter viele Fortune-100-Unternehmen.
Synthesia, ein von Nvidia unterstütztes Unternehmen für künstliche Intelligenz (KI), hat ein innovatives Upgrade vorgestellt, das KI-Avatare so ausstattet, dass sie menschliche Emotionen und Handlungen nachahmen können. Am 25. April brachte das Unternehmen seine "Expressive Avatars" auf den Markt, die entwickelt wurden, um Gefühle im Einklang mit Textbefehlen darzustellen, die hauptsächlich für Unternehmenspräsentationen, Marketing und Lehrfunktionen verwendet werden.
Obwohl generative KI für ihre Fähigkeit gelobt wird, überzeugende animierte Grafiken zu erstellen, wie der Sora-Videogenerator von OpenAI zeigt, ist sie immer noch weit davon entfernt, perfekt zu sein, insbesondere wenn es darum geht, Menschen nachzuahmen, was oft zu verzerrten Körperteilen, nicht übereinstimmenden Hintergründen oder unkoordinierten Lippenbewegungen mit Sprache führt. Synthesia versucht, diese Ungenauigkeiten in seiner neuesten Iteration zu korrigieren, die mit echten Menschen entwickelt wurde, die Skripte lesen. Dieser Ansatz hilft Bots dabei, die Genauigkeit der Lippenbewegungen zu perfektionieren und ihre emotionale Repräsentation zu verfeinern. Der CEO und Mitbegründer von Synthesia, Victor Ribarbelli, hob in einem Video hervor, dass Avatare im Gegensatz zu Menschen bisher kein Sprachverständnis hatten, was ihnen angemessene Gesichtsreaktionen raubte.
Das Training im Studio beinhaltete die erfolgreiche Reaktion der Avatare auf grundlegende Anweisungen wie "Ich bin glücklich. Ich bin traurig. Ich bin frustriert", was zu einer genauen Replikation der damit verbundenen Gesichtssignale und der Intonation führt. Die neuen Avatare des Unternehmens unterstützen über 130 Sprachen, bieten automatische Untertitel und können die Stimme eines Benutzers duplizieren. Das englische Sprachmodell erweist sich als das realistischste und ausgefeilteste unter anderen Sprachmodellen, basierend auf einem Test von Cointelegraph.
Synthesia, das mindestens die Hälfte der Fortune-100-Unternehmen zu seinen Kunden zählt, betreut mehr als 55.000 Unternehmen, darunter Marktführer wie Zoom, Xerox, Microsoft und Reuters, um nur einige zu nennen. Das 2017 in Großbritannien gegründete Unternehmen hat eine Bewertung von fast 1 Milliarde US-Dollar erreicht, angetrieben durch den jüngsten KI-Anstieg und die Unterstützung bedeutender Akteure wie Nvidia, die die Innovation von KI-Halbleiterchips anführen. Mit seiner fokussierten Mission, lebensechte Avatare für kommerzielle Anwendungen zu entwickeln, ist es Synthesia gelungen, einen Teil der überhitzten Rivalität im Chatbot-Bereich zu umgehen, in dem Modelle wie ChatGPT von OpenAI und Googles Gemini-Chatbot Kopf an Kopf gegeneinander antreten.
Published At
4/26/2024 2:51:52 PM
Disclaimer: Algoine does not endorse any content or product on this page. Readers should conduct their own research before taking any actions related to the asset, company, or any information in this article and assume full responsibility for their decisions. This article should not be considered as investment advice. Our news is prepared with AI support.
Do you suspect this content may be misleading, incomplete, or inappropriate in any way, requiring modification or removal?
We appreciate your report.