首页 > 科技周边 > 人工智能

AI自主智能体的全面概览：构建、应用、评估全方位覆盖，人大高瓴文继荣等32页综述

来源：51CTO.COM

时间：2023-08-31 21:47:16 362浏览收藏

你在学习科技周边相关的知识吗？本文《AI自主智能体的全面概览：构建、应用、评估全方位覆盖，人大高瓴文继荣等32页综述》，主要介绍的内容就涉及到，如果你想提升自己的开发能力，就不要错过这篇文章，大家要知道编程理论基础和实战操作都是不可或缺的哦！

在当前的AI时代，自主智能体被认为是通向通用人工智能（AGI）的一条有前途的途径。自主智能体指的是能够通过自主规划和指令来完成任务的实体。在早期的开发模式中，智能体的行动策略主要基于启发式，并在与环境的交互中逐步改进

然而，在无限制的开放环境中，自主智能体的行动往往难以达到人类的熟练水平

近年来，大语言模型（LLM）取得了巨大的成功，并展现出实现类人智能的潜力。由于其强大的能力，LLM 被越来越多地用作创建自主智能体的核心协调者，并出现了各种各样的AI智能体。这些智能体通过模仿类人的决策过程，为更复杂和适应性更强的AI系统提供了一条可行的路径

AI自主智能体的全面概览：构建、应用、评估全方位覆盖，人大高瓴文继荣等32页综述

基于LLM的自主智能体一览，包括工具智能体、模拟智能体、通用智能体和领域智能体

对于已经出现的基于LLM的自主智能体进行整体分析，在当前阶段非常重要。这样做可以全面了解该领域的发展现状，并且对未来的研究提供启发，具有重要意义

在这篇文章中，中国人民大学高瓴人工智能学院的研究人员对基于LLM的自主智能体进行了全面调查，并关注了它们的构建、应用和评估三个方面

AI自主智能体的全面概览：构建、应用、评估全方位覆盖，人大高瓴文继荣等32页综述

请点击以下链接查看论文：https://arxiv.org/pdf/2308.11432.pdf

为了构建智能体，研究者提出了一个由四部分组成的统一框架。这四部分分别是配置模块，用于表示智能体的属性；需要进行改写的内容是：记忆模块，用于存储历史信息；重新编写的内容是：设计模块，用于制定未来行动策略；以及行动模块，用于执行规划决定。在介绍了典型的智能体模块之后，研究者还总结了常用的微调策略，通过这些策略来增强智能体在不同应用场景中的适应性

研究者在接下来的内容中概述了自主智能体的潜在应用，并探讨了它们对社会科学、自然科学和工程学领域的增益。最后，讨论了自主智能体的评估方法，包括主观和客观评估策略。下图展示了文章的整体架构

AI自主智能体的全面概览：构建、应用、评估全方位覆盖，人大高瓴文继荣等32页综述图源：https://github.com/Paitesanshi/LLM-Agent-Survey

基于 LLM 的自主智能体构建

为了提高基于LLM的自主智能体的效率，需要考虑两个方面：首先，设计一个能够更好利用LLM的架构；其次，有效地学习参数的方法

智能体架构设计：本文提出了一个统一的框架来总结之前研究中提出的架构，整体结构如图2所示，它由分析（profiling）模块、需要进行改写的内容是：记忆模块、重新编写的内容是：设计模块以及需要重新写作的是：动作模块组成

AI自主智能体的全面概览：构建、应用、评估全方位覆盖，人大高瓴文继荣等32页综述

总结而言，重写内容为：分析模块的目的是识别智能体的角色；记忆和重新编写的内容是：设计模块可以将智能体置于动态环境中，使其能够回忆过去的行为并计划未来的行动；需要重新写作的是：动作模块负责将智能体的决策转化为具体的输出。这些模块中，重写内容为：分析模块对记忆和重新编写的内容是：设计模块产生影响，而这三个模块共同影响需要重新写作的是：动作模块

重写内容为：分析模块

自主智能体通过特定角色来执行任务，例如程序员、教师和领域专家。重写内容为：分析模块旨在表明智能体的角色是什么，这些信息通常被写入输入提示中以影响 LLM 行为。在现有的工作中，有三种常用的策略来生成智能体配置文件：手工制作方法；LLM-generation 方法；数据集对齐方法。

需要进行改写的内容是：记忆模块

需要进行改写的内容是：记忆模块在 AI 智能体的构建中起着非常重要的作用。它记忆从环境中感知到的信息，并利用记录的记忆来促进智能体未来的动作。需要进行改写的内容是：记忆模块可以帮助智能体积累经验、实现自我进化，并以更加一致、合理、有效的方式完成任务。

重新编写的内容是：设计模块

当人类面临复杂任务时，他们首先将其分解为简单的子任务，然后逐一解决每个子任务。重新编写的内容是：设计模块赋予基于 LLM 的智能体解决复杂任务时需要的思考和规划能力，使智能体更加全面、强大、可靠。本文介绍了两种重新编写的内容是：设计模块：没有反馈的规划以及有反馈的规划。

需要重新写作的是：动作模块

需要重新写作的是：动作模块的目的是将智能体的决策转化为具体的结果输出。它直接与环境进行交互，决定智能体完成任务的有效性。本节将介绍动作目标、策略、动作空间和动作影响

本章除了上述的四个部分之外，还会介绍智能体的学习策略。这些策略包括从示例中学习、从环境反馈中学习以及从与人类的互动反馈中学习

请参考表1，其中列出了之前的工作和本文的分类法之间的对应关系

AI自主智能体的全面概览：构建、应用、评估全方位覆盖，人大高瓴文继荣等32页综述

基于 LLM 的自主智能体应用

本章将讨论基于LLM的自主智能体对社会科学、自然科学和工程领域的革命性影响

AI自主智能体的全面概览：构建、应用、评估全方位覆盖，人大高瓴文继荣等32页综述

例如，可以利用基于LLM的智能体来设计和优化复杂的结构，如建筑物、桥梁、水坝和道路等。之前，研究人员提出了一个交互式框架，让人类建筑师和AI智能体在3D模拟中共同构建结构环境。交互式智能体能够理解自然语言指令、放置模块、寻求建议，并结合人类的反馈，展示了在工程设计中人机协作的潜力

在计算机科学和软件工程领域，基于LLM的智能体具有自动化编码、测试、调试和文档生成的潜力。研究者提出了ChatDev，这是一个端到端的框架，多个智能体通过自然语言对话进行沟通和协作，以完成软件开发生命周期。ToolBench可以用于代码自动补全和代码推荐等任务。MetaGPT可以扮演产品经理、架构师、项目经理和工程师等角色，内部监督代码生成并提高最终输出代码的质量等等

以下是基于LLM的自主智能体的代表性应用的列表：

AI自主智能体的全面概览：构建、应用、评估全方位覆盖，人大高瓴文继荣等32页综述