稳定性建设 -美团代码变更风险可视化系统建设与实践
变更是软件系统进化的推动力,同时也是孕育风险的温床。如果一个系统没有了相应的迭代和变更,那这个系统就… 继续阅读 稳定性建设 -美团代码变更风险可视化系统建设与实践
IT 数字化服务运营管理 之 运营的人工智能 (AIOps): 监控、管理、控制
变更是软件系统进化的推动力,同时也是孕育风险的温床。如果一个系统没有了相应的迭代和变更,那这个系统就… 继续阅读 稳定性建设 -美团代码变更风险可视化系统建设与实践
今天我带来的是“新零售运维保障解决方案”,内容包括三方面,新零售的现状以及它的挑战、运维保障体系以及… 继续阅读 盒马新零售运维保障解决方案
保障系统稳定性是现代软件开发中最具挑战性的问题之一,也是确保业务连续运行的重要因素。云服务、大型互联… 继续阅读 系统稳定性保障 – 相关能力成熟度模型介绍
一、背景 从 2010 年 Netflix 上线 Chaos Mokey 的第一个版本到现在,虽然混… 继续阅读 系统稳定性保障 – 迄今见过最易懂的混沌工程落地实践
近几年大家对于生产服务的稳定性越来越重视,无论是在技术大会还是企业的技术规划中,混沌工程越来越多的被… 继续阅读 系统稳定性保障 – 学习了大厂混沌工程故障演练思路就更清晰
什么是混沌工程 在生产环境中实际运行分布式系统,难免会有各种不可预料的突发事件发生。同时,云原生的发… 继续阅读 系统稳定性保障 – 字节跳动混沌工程故障演练实践总结
一、背景 随着货拉拉微服务架构、容器化技术广泛使用,软件架构的复杂度在不断提升,由服务之间的依赖所带… 继续阅读 系统稳定性保障 – 货拉拉微服务架构故障演练实践
引言阿里巴巴经过多年的技术演进,系统工具和架构已经高度垂直化,服务器规模也达到了比较大的体量。当服务… 继续阅读 系统稳定性保障 – 大厂故障演练思考
微服务架构场景中,应用系统复杂切分散。长期运行时,局部出现故障时不可避免的。如果发生故障时不能进行有… 继续阅读 系统稳定性保障 – 微服务架构下如何做好故障演练
简介:生产环境的突袭演练是我们迈出的艰难但有力的一步,锻炼了研发运维人员的应急响应能力,在真实用户场… 继续阅读 系统稳定性保障 – 云原生大潮下的混沌工程思考