Crypto News

Home
»
News

Cryptocurrency News 1 years ago

研究人员推进操作系统中的人工智能使用，将模型准确性提高 27%

Summary:

来自 Microsoft Research 和北京大学的一组科学家进行了一项研究，以了解为什么像 GPT-4 这样的大型语言模型（LLM）难以操纵操作系统。这些 AI 模型传统上通过强化学习进行训练，但由于多模态挑战和数据丢失风险，这些模型在操作系统环境中步履蹒跚。在一个名为 AndroidArena 的团队创建的独特培训环境中，他们确定了 LLM 缺乏的四项关键技能：理解、推理、探索和反思。令人惊讶的是，研究人员发现了一种“简单”的方法，通过解决缺乏“反射”的问题，将模型的准确性提高了27%。这项研究可以为先进的人工智能助手铺平道路。

制定一种让 ChatGPT 在操作系统中独立运行的策略一直很棘手，但Microsoft研究院和北京大学的科学家的合作努力可能已经找到了关键。研究人员开始进行探索，以查明为什么 GPT-4 等人工智能（AI）的大型语言模型（LLM）在需要操作系统操作的任务中失败。由 GPT-4 提供支持的 ChatGPT 等尖端系统为撰写电子邮件或写诗等生成任务设定了标准。但是，使这些模型能够在一般环境中作为代理运行会带来一系列试验。通常，人工智能模型通过强化学习来学习协商虚拟环境。人工智能创作者已经利用了《超级马里奥兄弟》和《我的世界》等知名视频游戏的修改版本，传授了关于自行探索和目标瞄准的知识。然而，操作系统对人工智能模型提出了独特的挑战。作为代理，在操作系统中执行功能经常会带来多模式障碍，涉及各种组件、应用程序和程序之间的信息交换。在强化训练的背景下，该方法很大程度上取决于实验。当密码多次输入错误或不清楚不同应用程序中的适用快捷方式时，此方法可能会导致数据丢失。相关新闻： ChatGPT 的核武器倾向、SEGA 的 80 年代 AI、TAO 的 90% 增长：AI Eye 该科学家小组与多个 LLM 合作，包括 Meta 开源的 LLM，例如 Llama2 70B 和 OpenAI 的 LLM，例如 GPT-3.5 和 GPT-4。研究发现，这些 LLM 都没有表现出卓越的表现。正如该团队的研究论文所述，由于几个原因，当前的需求取代了当今人工智能的能力。他们开创了一个名为 AndroidArena 的新颖培训环境，允许 LLM 在类似于 Android 操作系统的设置中导航。在建立了测试任务和基准系统后，他们发现LLM主要缺乏四个关键技能：理解、推理、探索和反思。尽管研究的重点是查明问题，但研究人员出乎意料地发现了一种将模型准确性提高 27% 的简单方法。他们通过向模型中输入有关其先前尝试和在这些尝试中使用的策略的自动信息来解决缺乏反射的问题。在用于触发操作的提示中嵌入内存可确保这一点。这一系列研究可能对创建改进的人工智能助手产生深远的影响。

#Microsoft，OpenAI

Published At

2/12/2024 11:37:47 PM

Disclaimer: Algoine does not endorse any content or product on this page. Readers should conduct their own research before taking any actions related to the asset, company, or any information in this article and assume full responsibility for their decisions. This article should not be considered as investment advice. Our news is prepared with AI support.

Do you suspect this content may be misleading, incomplete, or inappropriate in any way, requiring modification or removal? We appreciate your report.

Try Free

Start exploring Algoine for 7 days.

No Credit-Card Required!

Crypto News

研究人员推进操作系统中的人工智能使用，将模型准确性提高 27%

Summary:

Published At

Report

Try Free

Cookie Consent