Live Chat

Crypto News

Cryptocurrency News 7 months ago
ENTRESRUARPTDEFRZHHIIT

Исследователи расширяют использование ИИ в операционных системах и повышают точность моделей на 27%

Algoine News
Summary:
Команда ученых из Microsoft Research и Пекинского университета провела исследование, чтобы понять, почему большие языковые модели (LLM), такие как GPT-4, с трудом манипулируют операционными системами. Эти модели ИИ, традиционно обучаемые с помощью обучения с подкреплением, дают сбои в средах ОС из-за мультимодальных проблем и риска потери данных. В уникальной учебной среде, созданной командой под названием AndroidArena, они определили четыре ключевых навыка, которых не хватало магистрам права: понимание, рассуждение, исследование и рефлексия. Неожиданно исследователи обнаружили «простой» метод, который повысил точность модели на 27% за счет устранения отсутствия «отражения». Это исследование может проложить путь к продвинутому помощнику с искусственным интеллектом.
Разработка стратегии независимого функционирования ChatGPT в операционной системе была сложной задачей, но совместные усилия ученых из Microsoft Research и Пекинского университета, возможно, нашли ключ. Исследователи приступили к исследованию, чтобы точно определить, почему большие языковые модели (LLM) для искусственного интеллекта (ИИ), такие как GPT-4, не справляются с задачами, требующими манипуляций с операционной системой. Передовые системы, такие как ChatGPT, работающие на GPT-4, устанавливают стандарт для генеративных задач, таких как составление электронных писем или написание стихотворения. Тем не менее, если позволить этим моделям работать в качестве агентов в общей среде, это повлечет за собой ряд испытаний. Как правило, модели ИИ учатся взаимодействовать с виртуальными средами с помощью обучения с подкреплением. Создатели искусственного интеллекта использовали модифицированные версии известных видеоигр, таких как Super Mario Bros и Minecraft, чтобы поделиться знаниями о самодвижущемся исследовании и прицеливании. Однако операционные системы представляют собой уникальную проблему для моделей ИИ. Выполнение функций в ОС часто представляет собой мультимодальное препятствие, связанное с обменом информацией между различными компонентами, приложениями и программами. В контексте обучения с подкреплением подход во многом зависит от экспериментирования. Этот метод может привести к потере данных, например, когда пароли вводятся неправильно несколько раз или неясно применимые ярлыки в разных приложениях. Связанный: Склонность ChatGPT к ядерному оружию, ИИ SEGA 80-х годов, рост TAO на 90%: AI Eye Группа ученых работала с несколькими LLM, в том числе с открытым исходным кодом от Meta, такими как Llama2 70B, и с OpenAI, такими как GPT-3.5 и GPT-4. Исследование показало, что ни один из этих LLM не показал исключительных результатов. Как говорится в исследовательской работе команды, нынешние требования вытесняют возможности современного ИИ по нескольким причинам. Они первыми разработали новую среду обучения под названием AndroidArena, которая позволяла магистрам права ориентироваться в среде, аналогичной ОС Android. После того, как они установили тестовые задания и систему контрольных показателей, они обнаружили, что магистрам права в первую очередь не хватает четырех ключевых навыков: понимания, рассуждения, исследования и рефлексии. Несмотря на то, что основное внимание в исследовании уделялось выявлению проблемы, исследователи неожиданно обнаружили простой метод повышения точности модели на 27%. Они решили проблему отсутствия рефлексии, загрузив в модель автоматизированную информацию о ее предыдущих попытках и стратегиях, использованных во время них. Встраивание памяти в запросы, используемые для запуска действия, обеспечило это. Это направление исследований может иметь глубокие последствия для создания улучшенного помощника с искусственным интеллектом.

Published At

2/12/2024 11:37:47 PM

Disclaimer: Algoine does not endorse any content or product on this page. Readers should conduct their own research before taking any actions related to the asset, company, or any information in this article and assume full responsibility for their decisions. This article should not be considered as investment advice. Our news is prepared with AI support.

Do you suspect this content may be misleading, incomplete, or inappropriate in any way, requiring modification or removal? We appreciate your report.

Report

Fill up form below please

🚀 Algoine is in Public Beta! 🌐 We're working hard to perfect the platform, but please note that unforeseen glitches may arise during the testing stages. Your understanding and patience are appreciated. Explore at your own risk, and thank you for being part of our journey to redefine the Algo-Trading! 💡 #AlgoineBetaLaunch