OpenAI presenta innovadoras conversaciones visuales y multimodales; Amazon se asocia con Rival Anthropic
Summary:
OpenAI continúa innovando en el sector de la IA con la introducción de GPT-4V, un modelo con capacidades visuales y modos conversacionales multimodales para el sistema ChatGPT. Esta actualización permite a ChatGPT comprender y responder a consultas habladas en diferentes voces. El modelo mejorado se lanzará pronto a los usuarios Plus y Enterprise, y otros usuarios lo seguirán en breve. Además, DALL-E 3, el avanzado sistema de generación de imágenes de OpenAI, también integra el procesamiento del lenguaje natural. Mientras tanto, el competidor de OpenAI, Anthropic, ha asegurado una asociación con Amazon, que invertirá alrededor de $ 4 mil millones a cambio de soporte de IA y personalización de modelos.
OpenAI continúa interrumpiendo el campo de la inteligencia artificial generativa (IA) con la introducción de GPT-4V, un modelo con capacidades de visión y modos de conversación multimodales para ChatGPT. Estos avances, revelados el 25 de septiembre, permiten a los usuarios de ChatGPT entablar diálogos con el sistema. Los modelos actualizados, GPT-3.5 y GPT-4, permiten la comprensión de consultas habladas comunes y pueden reaccionar en uno de los cinco tonos de voz diferentes. Esto significa que ChatGPT ahora puede visualizar, escuchar y responder verbalmente. Además, los usuarios pueden disfrutar en breve de chats de voz con ChatGPT y tienen la capacidad de incorporar imágenes en sus conversaciones.
OpenAI explicó en una entrada de blog que esta nueva interfaz multimodal ofrece a sus usuarios formas únicas de interactuar con ChatGPT. Los usuarios pueden capturar fotos de puntos de referencia durante sus viajes y desarrollar discusiones interesantes sobre ellos o consultar sugerencias para la cena basadas en imágenes de su despensa y refrigerador. También pueden ayudar a su hijo a resolver problemas matemáticos fotografiando el ejercicio y pidiéndole pistas a ChatGPT.
OpenAI presentará la versión avanzada de ChatGPT a los usuarios móviles Plus y Enterprise dentro de los próximos quince días, mientras que los desarrolladores y otros usuarios tendrán acceso poco después. Esta actualización multimodal de ChatGPT viene en la parte posterior del lanzamiento de DALL-E 3, el sistema de creación de imágenes súper avanzado de OpenAI. DALL-E 3, según OpenAI, también incorpora procesamiento de lenguaje natural que brinda a los usuarios la capacidad de hablar con el modelo para ajustar los resultados e incluye ChatGPT para ayudar a generar indicaciones de imagen.
En más noticias del sector de IA, Amazon se ha asociado con el competidor de OpenAI, Anthropic, según un anuncio publicado el 25 de septiembre. Según los informes, Amazon invertirá aproximadamente $ 4 mil millones en servicios en la nube y accesibilidad de hardware. En consecuencia, Anthropic ampliará su soporte para el modelo Bedrock AI de Amazon, incluida la personalización segura del modelo y el ajuste fino de las empresas.
Published At
9/25/2023 5:15:00 PM
Disclaimer: Algoine does not endorse any content or product on this page. Readers should conduct their own research before taking any actions related to the asset, company, or any information in this article and assume full responsibility for their decisions. This article should not be considered as investment advice. Our news is prepared with AI support.
Do you suspect this content may be misleading, incomplete, or inappropriate in any way, requiring modification or removal?
We appreciate your report.