OpenAI stellt innovative visuelle KI und multimodale Konversationen vor; Amazon kooperiert mit Rival Anthropic
Summary:
OpenAI setzt seine Innovationen im KI-Sektor mit der Einführung von GPT-4V, einem Modell mit visuellen Fähigkeiten, und multimodalen Konversationsmodi für das ChatGPT-System fort. Dieses Upgrade ermöglicht es ChatGPT, gesprochene Anfragen mit verschiedenen Stimmen zu verstehen und darauf zu antworten. Das verbesserte Modell wird in Kürze für Plus- und Enterprise-Benutzer freigegeben, weitere Benutzer folgen in Kürze. Darüber hinaus integriert DALL-E 3, das fortschrittliche Bildgenerierungssystem von OpenAI, auch die Verarbeitung natürlicher Sprache. In der Zwischenzeit hat der Konkurrent von OpenAI, Anthropic, eine Partnerschaft mit Amazon geschlossen, das rund 4 Milliarden US-Dollar im Austausch für KI-Unterstützung und Modellanpassung investieren wird.
OpenAI revolutioniert den Bereich der generativen künstlichen Intelligenz (KI) mit der Einführung von GPT-4V, einem Modell mit Vision-Fähigkeiten und multimodalen Konversationsmodi für ChatGPT. Diese Fortschritte, die am 25. September bekannt gegeben wurden, ermöglichen es ChatGPT-Nutzern, mit dem System in Dialog zu treten. Die aktualisierten Modelle GPT-3.5 und GPT-4 ermöglichen das Verstehen häufig gesprochener Fragen und können in einem von fünf verschiedenen Stimmtönen reagieren. Das bedeutet, dass ChatGPT nun visualisieren, zuhören und verbal antworten kann. Außerdem können Benutzer mit ChatGPT in Kürze Voice-Chats genießen und haben die Möglichkeit, Bilder in ihre Gespräche einzubinden.
OpenAI erklärte in einem Blogeintrag, dass diese neue multimodale Schnittstelle seinen Nutzern einzigartige Möglichkeiten bietet, mit ChatGPT zu interagieren. Die Nutzer konnten während ihrer Reisen Fotos von Sehenswürdigkeiten aufnehmen und spannende Diskussionen darüber entwickeln oder Vorschläge für das Abendessen auf der Grundlage von Bildern ihrer Speisekammer und ihres Kühlschranks einsehen. Sie können ihrem Kind auch bei der Lösung mathematischer Probleme helfen, indem sie die Übung fotografieren und ChatGPT nach Hinweisen fragen.
OpenAI wird die erweiterte Version von ChatGPT innerhalb der nächsten zwei Wochen für mobile Plus- und Enterprise-Nutzer einführen, während Entwickler und andere Benutzer bald darauf Zugriff haben werden. Dieses multimodale Upgrade von ChatGPT folgt auf die Einführung von DALL-E 3 - dem superfortschrittlichen Bilderstellungssystem von OpenAI. DALL-E 3 enthält laut OpenAI auch die Verarbeitung natürlicher Sprache, die es den Benutzern ermöglicht, mit dem Modell zu sprechen, um die Ergebnisse zu verfeinern, und ChatGPT zur Unterstützung bei der Generierung von Bildaufforderungen einzubeziehen.
In weiteren Nachrichten aus dem KI-Sektor hat sich Amazon mit dem Konkurrenten von OpenAI, Anthropic, zusammengetan, wie aus einer am 25. September veröffentlichten Ankündigung hervorgeht. Amazon wird Berichten zufolge rund 4 Milliarden US-Dollar in Cloud-Dienste und Hardware-Zugänglichkeit investieren. Folglich wird Anthropic seine Unterstützung für Amazons Bedrock-KI-Modell erweitern, einschließlich der sicheren Modellanpassung und der Feinabstimmung von Unternehmen.
Published At
9/25/2023 5:15:00 PM
Disclaimer: Algoine does not endorse any content or product on this page. Readers should conduct their own research before taking any actions related to the asset, company, or any information in this article and assume full responsibility for their decisions. This article should not be considered as investment advice. Our news is prepared with AI support.
Do you suspect this content may be misleading, incomplete, or inappropriate in any way, requiring modification or removal?
We appreciate your report.