skip to content
swtywang's wiki
(Draft)

AI Agent 开发模式

/ 6 min read

Table of Contents

总结来说,AI Agent分位简单LLM应用、Single Agent、WorkFlow、Multi Agent四种模式。

1.1 简单LLM应用

通过提示词直接调用大模型api的方式,获取输出,常用于模型聊天等场景,这也是最简单的一种模式。

image-20260308223331386

1.2 Single Agent (智能体)

单智能体具备检索、工具和记忆等增强功能。 模型可以主动使用这些功能,例如搜索查询、选择适当的工具、保存必要的信息到记忆模块中等。

augmented-llm

受限于当前的模型能力,在复杂业务场景下单Agent无法很好完成任务,主要会有以下问题:

  • 如果一个agent包含太多的tools,模型在决策时会无所适从,效果变差
  • 多轮执行下来,消息上下文会变得很大,会影响模型的专注度(TODO:补一篇注意力转移机制,解释原因)
  • 模型上下文窗口受限
  • 复杂任务还需要专业领域的支持
  • 稳定性&可维护性变弱

为了改善上述问题,由此引出WorkFlow和Multi Agent两种模式。

1.3 WorkFlow(工作流)

工作流将任务拆解为多个节点,将整体任务流程固化下来,几个常见范式:

1.3.1 Chain

prompt-chaining

1.3.2 Routing

routing-workflow

1.3.3 parallelization

parallelization-workflow

1.3.4 Orchestrator-workers (编排者-工作者)

在这种 Workflow 中,一个中心式 LLM 动态地分解任务,将其委托给 worker LLM,并汇总它们的结果。

orchestrator-workers-workflow

适用于无法预测所需子任务的复杂任务。例如Code Review、智能搜索。

虽然在拓扑上与 Parallelization Workflow 相似,但关键区别在于其灵活性 —— 子任务不是预先定义的,而是由协调者/编排者根据特定输入确定的。

1.3.5 Evaluator-optimizer (评估者-优化者)

在这种 Workflow 中,一个 LLM call 生成响应,而另一个提供评估和反馈,形成一个闭环。适用于有明确的评估标准,并且迭代式改进确实有效,例如文档润色、测试用例评审。

evaluator-optimizer-workflow

参考:https://platform.claude.com/cookbook/patterns-agents-evaluator-optimizer

1.4 Multi-Agent架构

multi-agent

1.4.1 Single Agent

见1.2

1.4.2. Network(网状协作模式)

多个 Agent 互相连接,没有明显的上下级关系,大家是一个 Peer-to-Peer(点对点) 的网络。每个 Agent 都可以向其他 Agent 发起对话。

  • 优点: 灵活性极高。
  • 缺点: 由于缺乏约束,稳定性不高

1.4.3. Supervisor(主管模式)

一个核心的 Supervisor Agent(主管) 居中调度,指挥子 Agent 干活。所有指令都由主管分发,子 Agent 之间通常不直接沟通。

生活案例:

装修包工头。你(主管)负责接单和统筹。需要砸墙,你喊“拆旧师父”去;需要走线,你喊“水电工”去。水电工和拆旧师父不需要聊天,他们只对你负责。

  • 优点: 流程清晰解耦,容错率高。
  • 缺点: 主Agent效果最为关键,复杂任务中容易成为瓶颈

1.4.4 Supervisor (as tools)(主管-工具化模式)

LLM 调用的不是 API 工具,而是其他 Agent。

  • 优点: 极大地封装了复杂性。主模型不需要知道子任务的具体执行细节,只看结果。
  • 缺点: 依赖于子 Agent 的封装质量,且主模型难以干预子任务的中间过程。

1.4.5 Hierarchical(层级/树状模式)

Supervisor模式的升级版。主管下面有组长,组长下面有员工,形成严格的树状结构。

  • 优点: 极其适合处理大规模、长链路的复杂任务。分工明确,扩展性强(可以无限加层级)。
  • 缺点: 传递链条长,信息在层层传递中可能会丢失或失真(传话筒游戏效应)。响应速度相对较慢。

1.4.6 Custom(自定义流式模式)

一种有向图(Graph) 结构。Agent 之间的连接是根据特定业务逻辑定制的。数据流向是设计好的,不像 Network 那么乱,也不像 Hierarchical 那么死板。感觉很像WorkFlow

  • 优点: 专精于特定业务场景,效率最高,最稳定。工业界落地最常用的模式(比如 LangGraph)。
  • 缺点: 灵活性差,开发成本高。一旦业务流程变了,整个架构都要重写。
20251214224117.jpg

参考:

  1. https://arthurchiao.art/blog/build-effective-ai-agent-zh/
  2. https://www.cnblogs.com/xjk15082/p/19350118