测试专项 - 全链路压测与故障演练

swtywang2020年4月11日大约 3 分钟

全链路压测基本流程

全链路压测自动化实践

核心链路梳理 + 历史同期 Top 接口 + 近期 Top 接口 => 系统范围、接口 QPS/占比

日常压测会用到 Quake 平台，公司也在自研，正好 Quake 提供了很详细的技术文档简单了解下。
全链路压测平台（Quake）在美团中的实践

这里主要流量录制的部分，暂不考虑 QA 自己造数据

对于 HTTP 服务，在 Nginx 层都会产生请求的访问日志，我们对这些日志进行了统一接入，变成符合压测需要的流量数据。

由于 RPC 量级太大，无法采用 HTTP 的方案，这里使用对线上服务进行实时流量录制，结合 RPC 框架提供的录制功能，对集群中的某几台机器开启录制，根据要录制的接口和方法名，将请求数据上报到录制流量的缓冲服务（Broker）中，再由 Broker 生成最终的压测词表，上传到存储平台（S3）。

RPC 协议录制方案
- 代理模式
- 拦截器
- 中间件
- AOP
词表文件为什么需要分片，如何分片？
- 原因：后续压测肯定是由一个分布式的压测集群进行流量的打入，考虑到单机拉取词表的速度和加载词表的大小限制，如果将词表进行分片的话，可以有助于任务调度更合理的进行分配
- 怎么做？

大脑

https://developer.aliyun.com/article/982802
https://zhuanlan.zhihu.com/p/656615842

故障演练：