时尚 2024-11-05 11:45:47 19

功能超全的AI Agents开源库来了，能写小说，还能当导购、销售

来自波形智能、功能购销苏黎世联邦理工以及浙江大学的超全算法团队以及钻研者宣告了名为 Agents 的开源框架。

近一年来，当导随着大模子一劳永逸的源库睁开，基于大模子的小说推理泛化能耐的语言智能体 (Language Agents) 揭示了通向 AGI 的重大后劲。科研以及开拓者社区也泛起出种种语言智能体的功能购销框架以及零星，如 AutoGPT [1],超全 LangChain [2], SuperAGI [3] 等。这些零星可能接受人类提供的当导重大的指令之后自主妄想以及实施使命。尽管看起来很炫酷，源库这些框架以及零星的小说都存在一个颇为致命的通病：智能体的运行一旦开始，就简直脱离了人类的功能购销操作，对于使命妄想以及实施一旦侵蚀，超全就会经由倾向转达引起清晰的当导滚雪球效应，因此使命失败多少率很高。源库除了失败率高之外，小说更致命的是用户或者开拓者碰着这种情景，对于若何调优很简略残缺不脉络，只能自觉变更使命形貌，依靠玄学愿望患上到更好的下场。

为了处置这个痛点，让 LLM Agent 更可控，调优 LLM Agent 的历程更重大更零星化，波形智能散漫苏黎世联邦理工大学以及浙江大学，开拓了名为 Agents 的开源智能体框架。

论文链接：https://arxiv.org/pdf/2309.07870.pdf
代码 / Demo 链接：https://github.com/aiwaves-cn/agents
民间网站：http://www.aiwaves-agents.com/

Agents 框架探究了经由散漫基于推理图的标志主义 (symbolism) 推理以及基于 LLM 的衔接主义 (connectionism) 推理，来散漫高条理的天下模子知识以及低条理的重大推理泛化能耐，从而实现更智能更可控的通用家养智能 (AGI) 妄想。

详细来说，该框架立异性地提供了经由标志式的推理图，即 “SOP” ，来对于使命妨碍分解，初次实现为了对于 LLM Agent 的细粒度操作。框架同时反对于长短期影像，工具运用，收集搜查，以及多智能体零星的构建，用户惟独要用做作语言填写配置装备部署文档，就能轻松界说种种功能以及运用途景的 AI 智能体 / 多智能体零星，好比导购机械人，客服机械人，以及搜罗种种脚色的小说使命室。

在反对于零代码定制 / 微调多智能体零星的同时，Agents 框架也对于开拓者以及钻研者扩展新的功能以及定制重大的多智能体情景 / 场景提供了很好的反对于，为基于语言的智能体 (Language Agents) 钻研提供利便。Agents 框架的主要功能以及走光如下：

长短期影像：基于 RecurrentGPT [4] 的妄想让自主智能体可能坚持长短期影像，从而更好地以及人类 / 情景 / 其余智能体交互。临时影像将智能体自己的以及审核到的对于话 / 行动历史贮存在向量数据库 (VectorDB) 中并凭证之后的审核 (observation) ，经由语义搜查 (semantic search) 来抉择性的激活贮存的影像。短期影像则因此翰墨方式，经由 LLM+prompt 妨碍更新，负责智能体的 working memory。
工具运用 / 收集搜查：该框架经由将种种工具 / API 封装在 "ToolComponent" 类中，不同界说接口，让智能体可能经由 OpenAI GPT 的 function-calling 来智能地运用种种工具。收集搜查功能也被封装成为了 API，模子可能凭证需要，经由 function-calling 自动天生搜查 query，取患上搜查服从来辅助行动。
多智能体零星: Agents 框架中同时反对于单智能体以及多智能体零星。其中多智能体零星差距于现有框架的一点是，差距于其余零星艰深运用当时纪律好的纪律来抉择智能体行动的先后挨次，Agents 库之中反对于了基于 LLM 的操作器，可能凭证之后形态的目的，智能体的行动，以及之后情景，来抉择是否进入下一个形态，以及判断下一个行动的智能体理当是谁。
人 - 智能体交互: Agents 框架除了反对于多智能体之间的相互交互，也反对于了可能让人类运用者饰演多智能体零星中的一个或者多个智能体的功能，可能利便地反对于种种人 - 智能体交互的运用途景，如人以及智能体一起玩游戏、辩说等。
标志化细粒度操作：作为 Agents 框架的中间走光，框架中的 SOP 零星反对于了经由标志化的推理图来对于智能体 / 多智能体零星提供更细粒度的操作。一个使命 / 场景的 SOP 是一个图妄想，图中的每一个节点被称作 "形态"，每一个形态界说了该使命场景的一个子使命概况中间历程。用户可能在 Agent 零星的配置模版 (config template) 中界说每一个智能体在每一个形态中的使命形貌，策略，纪律，以及 in-context learning 的样例等。形态以及形态之间的切换经由一个基于 LLM 的操作器来抉择。基于 SOP 的细粒度的操作让智能体零星更可能严厉凭证人类确认过的流程运行，从而愈加晃动，可控，进而抵达可能作为商业化的客服 / 销售 / 导购等智能体的目的。此外由于智能体零星的操作严厉凭证 SOP 的流程，以是任何一步爆发下场，用户都可能利便的定位到下园地址，而且有针对于性地对于 SOP 妨碍更正，提升零星的展现，既后退了 Agent 零星的可批注性，又利便了零星的编纂以及调优。

Agents 框架介绍

Agents 框架搜罗三个主要类：Agent、SOP 以及 Environment，详细如下：

Agent 类搜罗了 Agent 的种种功能，搜罗长短期影像，审核情景，运用工具，调用 LLM 妨碍推理以及天生回覆等。
SOP 类是由形态以及形态之间的衔接定一个一个标志式的妄想（Plan）。SOP 的每一个形态节点由 State 类界说，State 类中涵盖了 Agent 在这个形态内特有模块化的 Prompt 以及可能运用的种种工具 / API 等，由用户在配置装备部署文件中界说。每一次行动时，Agent 会将这些模块化 prompt 以及工具 / API 的输入组装成残缺的 prompt，而后调用 LLM 抉择若何行动。SOP 中还搜罗了一个操作器函数，运用大模子的推理能耐来动态抉择形态的转移以及下一个行动的 Agent 是哪一个。
Environment (情景类) 是智能体之间交互的前言，贮存了智能体之间的对于话历史以及情景自己的形态 / 变更等。

智能体零星的初始化代码如下：所有类均可由一个用户定制好的 config 文件加载。

加载之后多智能零星的运行逻辑如下：SOP 的操作器抉择了下一个形态以及行动的智能体是哪一个，之后智能体散漫情景以及形态实执行动，最后情景凭证智能体的行动妨碍自我更新。Agents 框架同时反对于让智能体零星动态 Planning，天生新的后续形态以及节点，惟独要界说从 action 抽取新形态节点配置的函数并将对于应的配置动态削减到之后的 SOP 中即可。

运用 Agents 框架定制多智能体零星的流程

Step 1：配置装备部署多智能体零星参数 (框架提供了响应的 WebUI)

Step 2: 患上到 JSON 配置装备部署文件

Step 3：启动多智能体零星

基于 Agents 框架搭建的 “影视使命室” 零星

接下来，作者揭示了一个运用 Agents 框架开拓的多智能体影视使命室的 Demo。小说使命室中搜罗了作家，编纂，导演，以及演员等脚色。SOP 中纪律了首先作家以及编纂要凭证特定的剧情设定来想象人设以及剧本纲要，之后作家凭证纲要写出剧本，再由导演凭证剧本教育多个演员一起妨碍每一段情节的饰演：

其余的多智能体框架在接受了这样一个重大流程的调拨之后，很简略会在实施使命的历程中逐渐偏离原始的使命妄想以及调拨。这是由于在每一次实施的时候，各个智能体都只能凭证总体的相对于抽象的使命介绍来预料零星如今走到了哪一步以及接下来要做甚么，而基于 Agents 框架的智能体零星则为每一个智能体提供了之后形态特有的指令，纪律，以及示例，而且有清晰全局使命以及之后 / 下一个形态各自的目的的操作器来抉择形态的转变，因此可能更精确、晃动地沿着预先设定的流程完玉成数剧本妄想，创作到饰演的重大使命流。

Agents 框架除了反对于在终端以及 Gradio 体验多智能体零星之外，还为开拓者提供了运用 FastAPI 在后端部署自主智能体零星的示例代码，可能闪开拓者利便的将调教好的智能体部署到运用挨次中。此外 Agents 开拓团队还提供了 co妹妹unity AgentHub，可供利便地供用户搜查他人同享的智能体零星从而更利便地打造自己的智能体零星，也可能将自己调试好的智能体零星利便地同享给社区其余用户。

相关文章