跳转到内容

IT 运营管理:ITIL 最佳实践

IT 数字化服务运营管理 之 运营的人工智能 (AIOps): 监控、管理、控制

2024年 互联网故障盘点,我们能从故障中学到什么?

2024年已过,让我们来盘点今年出现的故障。回顾这一年,我们经历了各种挑战和困难,但也从中学到了许多… 继续阅读 2024年 互联网故障盘点,我们能从故障中学到什么?

  • 发表于: 2025年1月4日 2025年1月4日
  • 作者: viplao
  • 标签: 故障复盘

2024年复盘-互联网十大故障分析回顾

故障回顾随着2024年的圆满结束,今天,我有幸与各位一同回顾并深入探讨2024年中出现的一些具有代表… 继续阅读 2024年复盘-互联网十大故障分析回顾

  • 发表于: 2025年1月4日 2025年1月4日
  • 作者: viplao
  • 标签: 故障复盘, 经验教训

稳定性建设——《蚂蚁集团混沌工程技术理论与实践》

混沌初开,方兴未艾。混沌工程的概念由Netflix在2014年提出,近些年阿里,华为,腾讯,百度,工… 继续阅读 稳定性建设——《蚂蚁集团混沌工程技术理论与实践》

  • 发表于: 2024年12月29日 2024年12月29日
  • 作者: viplao
  • 标签: 稳定性建设

SRE工具链建设实践:一夜颠覆60%旧体系,腾讯的SRE运维转型实践(2)

一、前言 之前在《云原生背景下的运维价值思考与实践(上)》 里,重点介绍了云原生背景下运维转型的思考… 继续阅读 SRE工具链建设实践:一夜颠覆60%旧体系,腾讯的SRE运维转型实践(2)

  • 发表于: 2024年12月29日 2024年12月29日
  • 作者: viplao
  • 标签: 稳定性建设

SRE工具链建设实践:一夜颠覆60%旧体系,腾讯的SRE运维转型实践

讲师介绍 刘天斯,腾讯游戏营销SRE负责人,腾讯T12级技术专家,国家工程实验室兹聘专家(工业大数据… 继续阅读 SRE工具链建设实践:一夜颠覆60%旧体系,腾讯的SRE运维转型实践

  • 发表于: 2024年12月29日 2024年12月29日
  • 作者: viplao
  • 标签: 稳定性建设

CMDB是配置管理库它应该长得怎么样?数据资产体系如何建设?

一、认识数据资产 二、数据治理-方法论 三、CMDB平台建设 四、B站SRE资产平台建设之路 一、认… 继续阅读 CMDB是配置管理库它应该长得怎么样?数据资产体系如何建设?

  • 发表于: 2024年12月29日 2024年12月29日
  • 作者: viplao
  • 标签: 稳定性建设

混沌工程与SRE的结合(中国移动)

中国移动信息技术中心技术专家,中国移动磐基CMChaos平台负责人晁元宁分享了《混沌工程与SRE的结… 继续阅读 混沌工程与SRE的结合(中国移动)

  • 发表于: 2024年12月29日 2024年12月29日
  • 作者: viplao
  • 标签: 稳定性建设

平安夜美国航空停飞!股价暴跌超5%,运维工程师再背锅?事件回顾

12月24日,圣诞节前夕,原本应该是旅客出行最繁忙的时间段,美国航空公司的一则突发消息,让原本计划出… 继续阅读 平安夜美国航空停飞!股价暴跌超5%,运维工程师再背锅?事件回顾

  • 发表于: 2024年12月29日 2024年12月29日
  • 作者: viplao
  • 标签: 故障复盘

稳定性保障 – 故障应急体系构建及应用实践(2)

本文主要介绍了蚂蚁集团大规模互联网系统中业务SRE的稳定性实践,包括业务SRE的定义、应急管理、大促… 继续阅读 稳定性保障 – 故障应急体系构建及应用实践(2)

  • 发表于: 2024年12月29日 2024年12月29日
  • 作者: viplao
  • 标签: 稳定性建设

稳定性保障 – 故障应急体系构建及应用实践(1)

蚂蚁集团SRE技术专家刘凯宁在演讲中介绍了蚂蚁故障应急全流程体系,包括故障体系、应急体系、故障全生命… 继续阅读 稳定性保障 – 故障应急体系构建及应用实践(1)

  • 发表于: 2024年12月29日 2024年12月29日
  • 作者: viplao
  • 标签: 稳定性建设

分页

上一页 页码: 1 页码: 2 页码: 3 页码: 4 页码: 5 页码: 6 页码: 7 页码: 8 页码: 9 … 页码: 39 下一页

近期文章

  • 稳定性建设 – 高可用原则与设计
  • 系统稳定性建设(16) – 稳定架构设计思路
  • 系统稳定性建设(15) – 各大互联网公司稳定性治理之线上故障处理
  • 系统稳定性建设(14) – 稳定性治理思路与实践
  • 系统稳定性建设(13) – AI赋能稳定性思路

AI提示词 excel分析 flink sql 基础实践 ITIL最佳实践 Prompt攻略 Python运营分析技能 代码BUG 企业文化 危机管理, 变更执行 可观测性 告警治理 复盘 安全认知 宕机 实践案例 容量不足 思维认知 操作失误 故障复盘 故障治理 故障演练 数据分析 流程规范 混沌工程 稳定性保障 稳定性建设 稳定性治理实践 经验教训 舆情事件

© 2025                 IT 运营管理:ITIL 最佳实践.               粤ICP备2022017430号
本文部分内容摘录于互联网,只做参考学习,若有版权问题请联系处理               viplao@qq.com