稳定性建设 – 治理思路
一、背景 二、目标 提升 MTBF 缩短 MTTR,做到 MTTR 3-15-30 (3分钟发现,1… 继续阅读 稳定性建设 – 治理思路
IT 数字化服务运营管理 之 运营的人工智能 (AIOps): 监控、管理、控制
一、背景 二、目标 提升 MTBF 缩短 MTTR,做到 MTTR 3-15-30 (3分钟发现,1… 继续阅读 稳定性建设 – 治理思路
SRE实战中稳定性保障与架构优化的关键策略。讲师首先分析了SRE当前遇到的困境,提出了三个核心策略:… 继续阅读 稳定性建设 – 架构优化的关键策略
大型分布式系统稳定性建设的重要性与方法。首先,强调了高可用容灾架构的建设,遵循面向故障设计、墨菲定律… 继续阅读 稳定性建设 – 高可用容灾架构思路
混沌初开,方兴未艾。混沌工程的概念由Netflix在2014年提出,近些年阿里,华为,腾讯,百度,工… 继续阅读 稳定性建设——《蚂蚁集团混沌工程技术理论与实践》
一、前言 之前在《云原生背景下的运维价值思考与实践(上)》 里,重点介绍了云原生背景下运维转型的思考… 继续阅读 SRE工具链建设实践:一夜颠覆60%旧体系,腾讯的SRE运维转型实践(2)
讲师介绍 刘天斯,腾讯游戏营销SRE负责人,腾讯T12级技术专家,国家工程实验室兹聘专家(工业大数据… 继续阅读 SRE工具链建设实践:一夜颠覆60%旧体系,腾讯的SRE运维转型实践
一、认识数据资产 二、数据治理-方法论 三、CMDB平台建设 四、B站SRE资产平台建设之路 一、认… 继续阅读 CMDB是配置管理库它应该长得怎么样?数据资产体系如何建设?
中国移动信息技术中心技术专家,中国移动磐基CMChaos平台负责人晁元宁分享了《混沌工程与SRE的结… 继续阅读 混沌工程与SRE的结合(中国移动)
本文主要介绍了蚂蚁集团大规模互联网系统中业务SRE的稳定性实践,包括业务SRE的定义、应急管理、大促… 继续阅读 稳定性保障 – 故障应急体系构建及应用实践(2)
蚂蚁集团SRE技术专家刘凯宁在演讲中介绍了蚂蚁故障应急全流程体系,包括故障体系、应急体系、故障全生命… 继续阅读 稳定性保障 – 故障应急体系构建及应用实践(1)