新年10个Flag实现中~
访问量
2.7M
文章数
155
运行天
1477
前言长连接放到K8S之后,做性能测试就发现连接量上不去,在7~8W连接左右的时候,ELB的“波动队列”就开始暴增至1024,然后开始丢包。我一直有其他的工作要处理,这个排查又比较费时间,所以一直把这个事情搁置了。在迭代新版本的时候,发现连接量降至单个容器6W左右,反向优化最为致命…我的同事开始排查这个问题,最终找到是ELB的问题,记录一下他的思考过程,积累经验。一、问题描述在AWS的ELB(CLB)中,有一项监控指标叫做波动队列(SurgeQueue),长度最大为1024。波动队列的作用是,当后端服务器没有响应的时候,它会将请求包缓存起来,等服务器有响应了之后再把这些包慢慢消化掉,如果流量过大超过1024,则直接将包丢弃掉,避免在服务器处理能力有问题的时候遇到突增流量导致崩溃。在性能测试(P
1