Table of Contents
一、AI Agent 开发模式
总结来说,AI Agent分位简单LLM应用、Single Agent、WorkFlow、Multi Agent四种模式。
1.1 简单LLM应用
通过提示词直接调用大模型api的方式,获取输出,常用于模型聊天等场景,这也是最简单的一种模式。
1.2 Single Agent (智能体)
单智能体具备检索、工具和记忆等增强功能。 模型可以主动使用这些功能,例如搜索查询、选择适当的工具、保存必要的信息到记忆模块中等。
受限于当前的模型能力,在复杂业务场景下单Agent无法很好完成任务,主要会有以下问题:
- 如果一个agent包含太多的tools,模型在决策时会无所适从,效果变差
- 多轮执行下来,消息上下文会变得很大,会影响模型的专注度(TODO:补一篇注意力转移机制,解释原因)
- 模型上下文窗口受限
- 复杂任务还需要专业领域的支持
- 稳定性&可维护性变弱
为了改善上述问题,由此引出WorkFlow和Multi Agent两种模式。
1.3 WorkFlow(工作流)
工作流将任务拆解为多个节点,将整体任务流程固化下来,几个常见范式:
1.3.1 Chain
1.3.2 Routing
1.3.3 parallelization
1.3.4 Orchestrator-workers (编排者-工作者)
在这种 Workflow 中,一个中心式 LLM 动态地分解任务,将其委托给 worker LLM,并汇总它们的结果。
适用于无法预测所需子任务的复杂任务。例如Code Review、智能搜索。
虽然在拓扑上与 Parallelization Workflow 相似,但关键区别在于其灵活性 —— 子任务不是预先定义的,而是由协调者/编排者根据特定输入确定的。
1.3.5 Evaluator-optimizer (评估者-优化者)
在这种 Workflow 中,一个 LLM call 生成响应,而另一个提供评估和反馈,形成一个闭环。适用于有明确的评估标准,并且迭代式改进确实有效,例如文档润色、测试用例评审。
1.4 Multi-Agent架构
参考:
