记一次事故(数据库资源不足,导致业务失败,雪崩问题)

余于24日上线一版代码,验证没问题,下班、幸福的回家。

夜半,手机报警嗷嗷频发,冷淡直流,群里炸锅,谁今天上线了,这个锅自然是余了

报警是业务系统,请求查询,一致阻塞超时,获取不到数据库链接,余的代码虽然对数据库有些请求,但是思考之后,感觉不至于发生链接不足的情况,到底什么原因呢?

然后讲问题上升到更大的我方群,得知,有其它的业务组上线了更新库的操作,并且发生了死循环,他们的数据库链接占用的非常高,数据库服务器load飙升,恰巧,我们的库也在这个服务器上,于是........

一个数据库服务器部署了多台数据库实例,如果没做好资源隔离,很容易就会影响到其它的实例,毕竟资源有限。

猜你喜欢

转载自blog.csdn.net/sunguojian111/article/details/88074766