SRE工具链建设实践:一夜颠覆60%旧体系,腾讯的SRE运维转型实践
讲师介绍 刘天斯,腾讯游戏营销SRE负责人,腾讯T12级技术专家,国家工程实验室兹聘专家(工业大数据… 继续阅读 SRE工具链建设实践:一夜颠覆60%旧体系,腾讯的SRE运维转型实践
IT 数字化服务运营管理 之 运营的人工智能 (AIOps): 监控、管理、控制
讲师介绍 刘天斯,腾讯游戏营销SRE负责人,腾讯T12级技术专家,国家工程实验室兹聘专家(工业大数据… 继续阅读 SRE工具链建设实践:一夜颠覆60%旧体系,腾讯的SRE运维转型实践
一、认识数据资产 二、数据治理-方法论 三、CMDB平台建设 四、B站SRE资产平台建设之路 一、认… 继续阅读 CMDB是配置管理库它应该长得怎么样?数据资产体系如何建设?
中国移动信息技术中心技术专家,中国移动磐基CMChaos平台负责人晁元宁分享了《混沌工程与SRE的结… 继续阅读 混沌工程与SRE的结合(中国移动)
12月24日,圣诞节前夕,原本应该是旅客出行最繁忙的时间段,美国航空公司的一则突发消息,让原本计划出… 继续阅读 平安夜美国航空停飞!股价暴跌超5%,运维工程师再背锅?事件回顾
本文主要介绍了蚂蚁集团大规模互联网系统中业务SRE的稳定性实践,包括业务SRE的定义、应急管理、大促… 继续阅读 稳定性保障 – 故障应急体系构建及应用实践(2)
蚂蚁集团SRE技术专家刘凯宁在演讲中介绍了蚂蚁故障应急全流程体系,包括故障体系、应急体系、故障全生命… 继续阅读 稳定性保障 – 故障应急体系构建及应用实践(1)
2024年12月11日,OpenAI经历了一场全球范围的服务中断,持续时间超过四个小时,影响了Cha… 继续阅读 故障复盘 – 2024.12.11 OpenAI全球服务宕机复盘:技术架构的脆弱性与教训
一天,玛丽的儿子劳伦在摆弄 MIT 。当她在键盘上乱按的时候,一条错误信息突然出现。劳伦不知怎地启动… 继续阅读 第一个运维工程师
其实现在的计算机系统是一个极其复杂,而且依赖很多的分布式系统,出现事故是在所难免的,关键是如何对待事… 继续阅读 故障复盘 – 遇到P0级别故障如何做故障复盘?
引言 Python 是一种广泛使用的高级编程语言,其强大的功能和活跃的社区支持使得它成为许多开发者的… 继续阅读 PYTHON基础技能 – Python环境搭建与管理的9个常见问题解答