系统稳定性保障 – 学习了大厂混沌工程故障演练思路就更清晰
近几年大家对于生产服务的稳定性越来越重视,无论是在技术大会还是企业的技术规划中,混沌工程越来越多的被… 继续阅读 系统稳定性保障 – 学习了大厂混沌工程故障演练思路就更清晰
IT 数字化服务运营管理 之 运营的人工智能 (AIOps): 监控、管理、控制
近几年大家对于生产服务的稳定性越来越重视,无论是在技术大会还是企业的技术规划中,混沌工程越来越多的被… 继续阅读 系统稳定性保障 – 学习了大厂混沌工程故障演练思路就更清晰
什么是混沌工程 在生产环境中实际运行分布式系统,难免会有各种不可预料的突发事件发生。同时,云原生的发… 继续阅读 系统稳定性保障 – 字节跳动混沌工程故障演练实践总结
一、背景 随着货拉拉微服务架构、容器化技术广泛使用,软件架构的复杂度在不断提升,由服务之间的依赖所带… 继续阅读 系统稳定性保障 – 货拉拉微服务架构故障演练实践
引言阿里巴巴经过多年的技术演进,系统工具和架构已经高度垂直化,服务器规模也达到了比较大的体量。当服务… 继续阅读 系统稳定性保障 – 大厂故障演练思考
微服务架构场景中,应用系统复杂切分散。长期运行时,局部出现故障时不可避免的。如果发生故障时不能进行有… 继续阅读 系统稳定性保障 – 微服务架构下如何做好故障演练
简介:生产环境的突袭演练是我们迈出的艰难但有力的一步,锻炼了研发运维人员的应急响应能力,在真实用户场… 继续阅读 系统稳定性保障 – 云原生大潮下的混沌工程思考
大家好,我是来自去哪儿网的刘志志,19年加入去哪儿网,主要参与CI/CD平台建设,负责故障演练平台的… 继续阅读 系统稳定性保障 – 哪儿网故障演练实践经验