软件工程领域存在一个共识:维护代码所花费的时间要远多于写代码。而整个代码维护过程中,最惊心动魄与扣人… 继续阅读 IT 故障治理 – 运维救火必备:问题排查与系统优化手册(结合教训现身说法)

Amazon刚刚经历的云服务停机事故引发业界对云技术的又一番争论。 就在上周日上午时段,Amazon… 继续阅读 经验教训 – 2015.09.20 从Amazon最新云停机事故中学到的三个教训(亚马逊云宕机事件)

自12月18日阿里云香港可用区C因为机房水冷机组出现故障,导致一次阿里云历史上最长的宕机后,官方终于… 继续阅读 经验教训 – 狡兔务必三窟:阿里云香港可用区C宕机血的教训与反思

缺乏最佳实践的 DevOps,会给你的企业带来缓慢的发布周期,甚至是灾难性的错误。本文向你介绍一些能… 继续阅读 经验教训 – 2012.08.01 兵败DevOps!一个Bug损失4.6亿美金,不得不看的惨痛教训! 

前言 距离海天事件已经过去几个月了,事件带来的影响逐渐显现。 1个月时间,海天味业的股价由82.82… 继续阅读 经验教训 – 2022.09.23 海天事件的公关到底哪里出了问题 舆情反思