OpenAI svela l'innovativa intelligenza artificiale visiva e le conversazioni multimodali; Amazon collabora con Rival Anthropic
Summary:
OpenAI continua a innovare nel settore AI con l'introduzione di GPT-4V, un modello con capacità visive e modalità conversazionali multimodali per il sistema ChatGPT. Questo aggiornamento consente a ChatGPT di comprendere e rispondere alle domande vocali in voci diverse. Il modello migliorato sarà presto rilasciato agli utenti Plus ed Enterprise, con altri utenti che seguiranno a breve. Inoltre, DALL-E 3, il sistema avanzato di generazione di immagini di OpenAI, integra anche l'elaborazione del linguaggio naturale. Nel frattempo, il concorrente di OpenAI, Anthropic, si è assicurato una partnership con Amazon, che investirà circa 4 miliardi di dollari in cambio del supporto AI e della personalizzazione del modello.
OpenAI continua a sconvolgere il campo dell'intelligenza artificiale generativa (AI) con l'introduzione di GPT-4V, un modello con capacità di visione e modalità di conversazione multimodali per ChatGPT. Questi progressi, rivelati il 25 settembre, consentono agli utenti di ChatGPT di impegnarsi in dialoghi con il sistema. I modelli aggiornati, GPT-3.5 e GPT-4, consentono la comprensione delle domande vocali comuni e possono reagire in uno dei cinque diversi toni di voce. Ciò significa che ChatGPT può ora visualizzare, ascoltare e rispondere verbalmente. Inoltre, gli utenti possono godere brevemente delle chat vocali con ChatGPT e avere la possibilità di incorporare immagini nelle loro conversazioni.
OpenAI ha spiegato in un post sul blog che questa nuova interfaccia multimodale offre ai suoi utenti modi unici per interagire con ChatGPT. Gli utenti potrebbero catturare foto di punti di riferimento durante i loro viaggi e sviluppare discussioni coinvolgenti su di loro o consultare suggerimenti per la cena basati su immagini della loro dispensa e frigorifero. Possono anche aiutare il loro bambino a risolvere problemi di matematica fotografando l'esercizio e chiedendo indizi a ChatGPT.
OpenAI introdurrà la versione avanzata di ChatGPT agli utenti mobili Plus ed Enterprise entro le prossime due settimane, mentre gli sviluppatori e gli altri utenti avranno accesso subito dopo. Questo aggiornamento multimodale di ChatGPT arriva sulla scia del lancio di DALL-E 3 - il sistema di creazione di immagini super avanzato di OpenAI. DALL-E 3, secondo OpenAI, incorpora anche l'elaborazione del linguaggio naturale che offre agli utenti la possibilità di parlare con il modello per i risultati di messa a punto e includere ChatGPT per l'assistenza nella generazione di prompt di immagini.
In più notizie del settore AI, Amazon ha collaborato con il concorrente di OpenAI, Anthropic, secondo un annuncio pubblicato il 25 settembre. Secondo quanto riferito, Amazon investirà circa 4 miliardi di dollari per i servizi cloud e l'accessibilità hardware. Di conseguenza, Anthropic estenderà il suo supporto per il modello di intelligenza artificiale Bedrock di Amazon, compresa la personalizzazione sicura del modello e la messa a punto delle aziende.
Published At
9/25/2023 5:15:00 PM
Disclaimer: Algoine does not endorse any content or product on this page. Readers should conduct their own research before taking any actions related to the asset, company, or any information in this article and assume full responsibility for their decisions. This article should not be considered as investment advice. Our news is prepared with AI support.
Do you suspect this content may be misleading, incomplete, or inappropriate in any way, requiring modification or removal?
We appreciate your report.