在软件研发过程中,不可避免的存在由研发自测后上线的项目。在这种完全由研发同学独立完成开发、测试、发布… 继续阅读 IT服务治理 之 发布管理 – 对于研发自测上线项目,测试同学可以做点啥?

软件工程领域存在一个共识:维护代码所花费的时间要远多于写代码。而整个代码维护过程中,最惊心动魄与扣人… 继续阅读 IT 故障治理 – 运维救火必备:问题排查与系统优化手册(结合教训现身说法)

Amazon刚刚经历的云服务停机事故引发业界对云技术的又一番争论。 就在上周日上午时段,Amazon… 继续阅读 经验教训 – 2015.09.20 从Amazon最新云停机事故中学到的三个教训(亚马逊云宕机事件)

自12月18日阿里云香港可用区C因为机房水冷机组出现故障,导致一次阿里云历史上最长的宕机后,官方终于… 继续阅读 经验教训 – 狡兔务必三窟:阿里云香港可用区C宕机血的教训与反思