新年10个Flag实现中~
访问量
1.9M
文章数
150
运行天
1149
一、背景分布式压测1台主控机,15台从机,每台测试机1W长连接客户端,进行混合场景MQTT稳定性PubSub测试,发现服务器在跑了一天以后被重启了。(1)排除GC问题之前的PET测试中,发现偶尔会有长时间的FullGC,导致ServiceMesh探针几次没有响应而强行重启了服务器(那个是由于OpenTracing批量kafka消费的时候没有通过try-resource来释放资源造成堆内存泄漏)。因此看了下GC,发现FullGC耗时很短,次数很少,而且堆内存并没有爆炸。(2)发现内存增长有问题通过观察由Prometheus提供数据、Grafana绘制的图像,发现内存以1MB/分钟的速度几乎是线性增长到8G,然后由于达到了k8s的pod限制,被强行重启了。这种不正常的现象明显就是有内存泄漏,那么
1