语雀岩机
岩机开始
- 2023年10月23日,在离程序员节1024的前一天,语雀岩机8小时,午休起来打开语雀直接不能用啦
- 最开始以为是自己网络问题,还尝试重连wifi进行尝试,立马关注群,没想到官方群已经炸锅啦
官方通知
- 3点8分的时候 收到公众号官方通知
- 知道晚上10点左右发布官方通知服务全面恢复,语雀岩机差不多8小时左右,P0级事故妥妥的。
语雀复盘及补偿
- 原文链接:https://mp.weixin.qq.com/s/WFLLU8R4bmiqv6OGa-QMcw
- 从语雀发布的故障报告来看,还是敢于承担责任的,国外cloudflare ,gitlab也宕机过,重要的是宕机后有没有吸取教训,如何避免宕机。
- 应了那句话,昨天骂X,今天真香
打工人如何应对
语雀的故障报告
- 核心原因是上线时运维工具bug导致机器下线,按照常理手动上线问题不出意外就能解决,但恰恰存储系统使用的机器类别较老,无法直接操作上线,赶巧不巧了不是。
- 从备份机器恢复数据,由于数量较大,IO估计都得干冒烟,所以需要时间较长。
- 求求语雀啦,能不能上线个离线版本呢。。。。
打工人GET到什么
- 系统无论大小,除非造成资损需紧急上线,否则白天拒绝升级发布【生产环境嘛,不动大概率就不会出问题】
- 灰度发布的必要性,这个是非常有必要的,就算出问题,也是小部分人出问题
- 但像笔记软件这种,其实可选产品很多,本地软件也有,再把身家性命系到唯一的在线服务上就没那么明智了。如果没有协作需求,完全可以自己离线。即便有多人联网协作需求,语雀这次的宕机过后,相信笔记软件之间的互相备份,或者像题主提到的本地存储 + 云端备份 + 多人协作的想法,也会有相应的解决方案。
拒绝焦虑
- 线上的培训机构天天贩卖焦虑,今天学P6,明天学P7,不学就被淘汰。
- 不可否认学习是一个好习惯,但我还是建议大家减少无畏的精神内耗,天天都学高可用,异地灾备,其实大部分公司都不存在这样的业务体量。
- 但是现实嘛,大家都懂得。就看大家如何选择啦,【我选顺其自然,身体健康】
- 作为技术人员,对健康的关注往往被忽略,这也直接导致程序员们身体和心理健康的问题越来越突出。有一些工程师因为长期熬夜,身体本身已经出现了健康问题,这对他们的学习和工作都带来了很大的影响。
最后,祝福所有的程序员节日快乐,
愿你们的程序像一艘稳定的船只,载着用户顺利航行。
语雀宕机8小时,普通打工人该如何应对:阁下如何应对,我选顺其自然