系统稳定性保障 – 1-3-5-10的应急响应中心专业治理宕机
背景 随着业务规模的不断扩张和日常需求的快速迭代,即使是最优秀的业务架构、最完善的生产体系也无法确保… 继续阅读 系统稳定性保障 – 1-3-5-10的应急响应中心专业治理宕机
IT 数字化服务运营管理 之 运营的人工智能 (AIOps): 监控、管理、控制
背景 随着业务规模的不断扩张和日常需求的快速迭代,即使是最优秀的业务架构、最完善的生产体系也无法确保… 继续阅读 系统稳定性保障 – 1-3-5-10的应急响应中心专业治理宕机
最近一两年,我们可以发现混沌工程这个技术变得十分火热,大家都知道它变成了一个新的风口。常说做事情要顺… 继续阅读 系统稳定性保障 – 混沌工程 – 持续保障系统稳定性和高可用:腾讯游戏混沌工程实践
“阿里稳定分”不是一个官方术语,但我们可以基于阿里云对服务稳定性的重视和实践,构想一个类似的评估体系… 继续阅读 系统稳定性保障 – 事件激励与约束 故障分计算思路