经验教训 – 从10次宕机事件中,我学到重要的经验“不要心存侥幸,你担心的事情一定会发生”
今年的灾难事件有几点是比较深刻体会: 第 1 课:循环依赖会破坏你的运维工具流程工具与生产工具是结合… 继续阅读 经验教训 – 从10次宕机事件中,我学到重要的经验“不要心存侥幸,你担心的事情一定会发生”
IT 数字化服务运营管理 之 运营的人工智能 (AIOps): 监控、管理、控制
今年的灾难事件有几点是比较深刻体会: 第 1 课:循环依赖会破坏你的运维工具流程工具与生产工具是结合… 继续阅读 经验教训 – 从10次宕机事件中,我学到重要的经验“不要心存侥幸,你担心的事情一定会发生”
运维工程师面试者第一个问题是:需要值班吗?笔者自己也曾经历过月入十万的时期,在那个时候,数个系统同时… 继续阅读 经验教训 – 摘录多年运维监控报警优化经验总结文章
故障处理可参考麦肯锡30秒电梯法则思路,快速把问题陈述。 一 了解30秒电梯法则 谈到“… 继续阅读 经验教训 – 故障处理,教你30秒把问题说清楚
2022年,是网络安全市场高速发展的一年,同时也是企业评估安全项目投资有效性,校准和优化安全防御战略… 继续阅读 经验教训 – 网络安全十四条经验教训
Facebook 深入探讨的问题是:“人类应当留意哪些 IT 告警?” Facebook 的产品工程… 继续阅读 告警服务治理 – 简单有效经验分享
科技行业经历了许多重大挫折事件,比如埃隆·马斯克(Elon Musk)被迫接管推特、元宇宙仍未腾飞、… 继续阅读 经验教训 – 美媒:2022年IT行业经历太多重大挫折,有8点深刻教训
包括微信语音、账号登录、朋友圈,以及微信支付,都无法正常使用。 有网友表示,电脑版微信大概是在早上1… 继续阅读 经验教训 – 3.29 #微信QQ出现功能异常#,冲上热搜,妥妥的第一
Amazon刚刚经历的云服务停机事故引发业界对云技术的又一番争论。 就在上周日上午时段,Amazon… 继续阅读 经验教训 – 2015.09.20 从Amazon最新云停机事故中学到的三个教训(亚马逊云宕机事件)
618&&双11 作为研发,尤其是后端研发,每年在618或者双11的时候压力特别大,… 继续阅读 经验教训 – 服务稳定性SLA-2015年阿里双十一惨痛的教训
2月23日晚7点左右,微盟多个小程序显示出现未知错误,多次刷新仍未恢复正常。 基于微盟的商家… 继续阅读 经验教训 – 2020.02.23 微盟花23亿买下一个惨痛教训