AI Agent 开发模式 • swtywang's wiki

总结来说，AI Agent分位简单LLM应用、Single Agent、WorkFlow、Multi Agent四种模式。

1.1 简单LLM应用

通过提示词直接调用大模型api的方式，获取输出，常用于模型聊天等场景，这也是最简单的一种模式。

单智能体具备检索、工具和记忆等增强功能。模型可以主动使用这些功能，例如搜索查询、选择适当的工具、保存必要的信息到记忆模块中等。

受限于当前的模型能力，在复杂业务场景下单Agent无法很好完成任务，主要会有以下问题：

为了改善上述问题，由此引出WorkFlow和Multi Agent两种模式。

工作流将任务拆解为多个节点，将整体任务流程固化下来，几个常见范式：

在这种 Workflow 中，一个中心式 LLM 动态地分解任务，将其委托给 worker LLM，并汇总它们的结果。

适用于无法预测所需子任务的复杂任务。例如Code Review、智能搜索。

虽然在拓扑上与 Parallelization Workflow 相似，但关键区别在于其灵活性 —— 子任务不是预先定义的，而是由协调者/编排者根据特定输入确定的。

在这种 Workflow 中，一个 LLM call 生成响应，而另一个提供评估和反馈，形成一个闭环。适用于有明确的评估标准，并且迭代式改进确实有效，例如文档润色、测试用例评审。

见1.2

多个 Agent 互相连接，没有明显的上下级关系，大家是一个 Peer-to-Peer（点对点）的网络。每个 Agent 都可以向其他 Agent 发起对话。

一个核心的 Supervisor Agent（主管）居中调度，指挥子 Agent 干活。所有指令都由主管分发，子 Agent 之间通常不直接沟通。

装修包工头。你（主管）负责接单和统筹。需要砸墙，你喊“拆旧师父”去；需要走线，你喊“水电工”去。水电工和拆旧师父不需要聊天，他们只对你负责。

LLM 调用的不是 API 工具，而是其他 Agent。

Supervisor模式的升级版。主管下面有组长，组长下面有员工，形成严格的树状结构。

一种有向图（Graph）结构。Agent 之间的连接是根据特定业务逻辑定制的。数据流向是设计好的，不像 Network 那么乱，也不像 Hierarchical 那么死板。感觉很像WorkFlow

参考：