OpenAI представляет GPT-4o: скачок вперед в мультимодальном взаимодействии ИИ в реальном времени
Summary:
Компания OpenAI представила новую модель искусственного интеллекта GPT-4o, продвинутого чат-бота, способного обрабатывать и реагировать на аудио, визуальные и текстовые вводы в режиме реального времени. Демонстрации технологии продемонстрировали ее разнообразные возможности, от помощи пользователям в выполнении различных задач, таких как подготовка к собеседованию, до обнаружения эмоций пользователей. Ожидается, что модель, которая значительно превосходит предыдущие инструменты искусственного интеллекта OpenAI, будет стимулировать более естественное взаимодействие человека и компьютера. Его развертывание началось 13 мая, начиная с ввода текста и изображений, а обновления голосового и видеоввода будут запущены в ближайшие недели.
OpenAI, создатель ChatGPT, представил свое новейшее предложение в области искусственного интеллекта, GPT-4o, более крупный разговорный и сверхъестественно человекоподобный компаньон для чата с искусственным интеллектом, который может анализировать и реагировать как на аудио, так и на визуальные вводы пользователя в режиме реального времени. Серия демонстраций, предоставленных компанией, показывает, что GPT-4 Omni помогает потенциальным пользователям в различных задачах, включая визуальную подготовку к собеседованию при приеме на работу, обращение в службу поддержки клиентов для замены iPhone и судейство в игре «камень-ножницы-бумага» между двумя людьми. Было даже показано, как чат-бот с искусственным интеллектом произносит отцовские шутки, переводит двуязычные разговоры в режиме реального времени и остроумно отвечает, как показано в одной из демонстраций, когда он был впервые представлен щенку пользователя.
OpenAI официально представила GPT-4o, продвинутую модель с возможностями аудио-, визуального и текстового взаимодействия в режиме реального времени: https://t.co/MYHZB79UqN
Развертывание текстового и графического ввода в API и ChatGPT начинается сегодня, а обновления голосовой и видеосвязи последуют в ближайшие недели. pic.twitter.com/uuthKZyzYx — OpenAI (@OpenAI) 13 мая 2024
«Это похоже на искусственный интеллект, который вы видите в фильмах, и я до сих пор немного поражен его реальностью», — признался генеральный директор OpenAI Сэм Альтман в своем блоге от 13 мая. «Достижение человеческого времени отклика и выразительности — это важная веха». 13 мая была запущена версия только для ввода текста и изображений, а полная версия должна быть выпущена в ближайшие недели, согласно заявлению OpenAI в недавнем сообщении X. Как бесплатные, так и платные пользователи ChatGPT будут иметь доступ к GPT-4o из API ChatGPT. Буква «o» в слове GPT-4o означает «omni», сигнализируя о переходе к более естественным способам взаимодействия между людьми и компьютерами.
GPT-4o раздвигает границы инноваций в области искусственного интеллекта, одновременно обрабатывая вводимый текст, аудио и изображения, что является важным шагом вперед по сравнению с предыдущими инструментами искусственного интеллекта OpenAI, такими как ChatGPT-4, которые обычно «оставляли значительный объем информации» на столе при выполнении задачи многозадачности. OpenAI заявляет, что «GPT-4o превосходит предыдущие модели с точки зрения аудио- и визуального понимания», включая обнаружение эмоций и дыхания пользователей. Он также «значительно быстрее» и «на 50% дешевле» по сравнению с GPT-4 Turbo в API OpenAI. OpenAI утверждает, что недавно запущенный инструмент искусственного интеллекта может отвечать на аудиовходы за 2,3 секунды, в среднем около 3,2 секунды, что соответствует типичной продолжительности человеческого ответа в повседневном разговоре.
Published At
5/14/2024 3:32:23 AM
Disclaimer: Algoine does not endorse any content or product on this page. Readers should conduct their own research before taking any actions related to the asset, company, or any information in this article and assume full responsibility for their decisions. This article should not be considered as investment advice. Our news is prepared with AI support.
Do you suspect this content may be misleading, incomplete, or inappropriate in any way, requiring modification or removal?
We appreciate your report.