基于大语言模型的规划
文章目录
- 整体框架
- 方案生成
- 反馈获取
虽然上下文学习和思维链提示方法形式上较为简洁且较为通用,但是在面对诸如几何数学求解、游戏、代码编程以及日常生活任务等复杂任务时仍然表现不佳。为了解决这类复杂任务,可以使用基于大语言模型的规划(Planning)。该方法的核心思想在于将复杂任务分解为若干相关联的子任务,并围绕这些子任务制定包含一系列执行动作(Action)的解决方案,从而将复杂任务的求解转换为一系列更为简单的子任务依次求解,进而简化了任务难度。
整体框架
如下图所示,基于大语言模型的规划方法主要由三个组件构成,包括任务规划器(TaskPlanner)、规划执行器(PlanExecutor)以及环境(Environment)。具体来说,大语言模型作为任务规划器,其主要职责是生成目标任务的解决方案。该方案包含一系列执行动作,每个动作通过合适的形式进行表达,例如自然语言描述或代码片段。对于长期任务,任务规划器还可以引入存储机制,用于解决方案与中间执行结果的存储与检索。规划执行器则负责执行解决方案中所涉及到的动作。根据任务性质的不同,规划执行器可以由大语言模型实现,也可以由执行具体物理任务的实体(如机器人)来实现。环境是规划执行器实施动作的具体场景,不同任务对应着不同的执行环境,例如Web互联