跳转到内容

IT 运营管理:ITIL 最佳实践

IT 数字化服务运营管理 之 运营的人工智能 (AIOps): 监控、管理、控制

故障复盘标签存档订阅

故障复盘 25.6.6 :服务瘫痪5小时!阿里云核心域名遭劫持,究竟谁是幕后黑手?

事件经过 ■ 02:57:阿里云监控发现 aliyuncs.com 域名解析出现异常,阿里云工程师正… 继续阅读 故障复盘 25.6.6 :服务瘫痪5小时!阿里云核心域名遭劫持,究竟谁是幕后黑手?

  • 发表于: 2025年6月14日 2025年6月14日
  • 作者: viplao
  • 标签: 故障复盘, 经验教训

故障复盘 :Case Study: 故障复盘通用模版

1. 详细描述(必填) 详细的 bug 描述, 包含可以复现的环境准备(比如测试包、有问题的 com… 继续阅读 故障复盘 :Case Study: 故障复盘通用模版

  • 发表于: 2025年6月14日 2025年6月14日
  • 作者: viplao
  • 标签: 故障复盘

故障复盘 25.6.13 – 谷歌云故障背后,是什么让 “更新” 变 “灾难”?

2025年06月13日01时49分(北京时间),谷歌云GCP服务(云计算服务平台),对全球分布式AP… 继续阅读 故障复盘 25.6.13 – 谷歌云故障背后,是什么让 “更新” 变 “灾难”?

  • 发表于: 2025年6月13日 2025年6月13日
  • 作者: viplao
  • 标签: 故障复盘, 经验教训

支付宝5分钟狂亏上亿,不追款实有不得已的苦衷

一、 大事件,2025年1月16日,支付宝给大家发福利啦。 当日14:40-14:45,所有通过支付… 继续阅读 支付宝5分钟狂亏上亿,不追款实有不得已的苦衷

  • 发表于: 2025年1月18日 2025年1月18日
  • 作者: viplao
  • 标签: 故障复盘

支付宝打8折P0资损故障思考

2025年1月16日下午14:40至14:45,支付宝平台出现重大故障。在这短短5分钟内,用户在进行… 继续阅读 支付宝打8折P0资损故障思考

  • 发表于: 2025年1月18日 2025年1月18日
  • 作者: viplao
  • 标签: 故障复盘

2024年十大网络安全事件盘点

10大网络安全事件 1微软高管邮箱被“午夜暴雪”攻陷 2024年1月,微软披露其遭到了威胁组织“午夜… 继续阅读 2024年十大网络安全事件盘点

  • 发表于: 2025年1月4日 2025年1月4日
  • 作者: viplao
  • 标签: 故障复盘

2024年 互联网故障盘点,我们能从故障中学到什么?

2024年已过,让我们来盘点今年出现的故障。回顾这一年,我们经历了各种挑战和困难,但也从中学到了许多… 继续阅读 2024年 互联网故障盘点,我们能从故障中学到什么?

  • 发表于: 2025年1月4日 2025年1月4日
  • 作者: viplao
  • 标签: 故障复盘

2024年复盘-互联网十大故障分析回顾

故障回顾随着2024年的圆满结束,今天,我有幸与各位一同回顾并深入探讨2024年中出现的一些具有代表… 继续阅读 2024年复盘-互联网十大故障分析回顾

  • 发表于: 2025年1月4日 2025年1月4日
  • 作者: viplao
  • 标签: 故障复盘, 经验教训

平安夜美国航空停飞!股价暴跌超5%,运维工程师再背锅?事件回顾

12月24日,圣诞节前夕,原本应该是旅客出行最繁忙的时间段,美国航空公司的一则突发消息,让原本计划出… 继续阅读 平安夜美国航空停飞!股价暴跌超5%,运维工程师再背锅?事件回顾

  • 发表于: 2024年12月29日 2024年12月29日
  • 作者: viplao
  • 标签: 故障复盘

故障复盘 – 2024.12.11 OpenAI全球服务宕机复盘:技术架构的脆弱性与教训 

2024年12月11日,OpenAI经历了一场全球范围的服务中断,持续时间超过四个小时,影响了Cha… 继续阅读 故障复盘 – 2024.12.11 OpenAI全球服务宕机复盘:技术架构的脆弱性与教训 

  • 发表于: 2024年12月28日 2024年12月28日
  • 作者: viplao
  • 标签: 故障复盘

分页

页码: 1 页码: 2 页码: 3 页码: 4 页码: 5 页码: 6 下一页

近期文章

  • 稳定性建设体系 – 故障应急案例学习
  • 稳定性建设体系 – 故障处理案例学习
  • 稳定性建设体系 – 容量管理案例学习
  • 稳定性建设 – 混沌工程案例学习
  • 稳定性建设体系 – 架构优化案例学习

AI提示词 excel分析 flink sql 基础实践 ITIL最佳实践 Prompt攻略 Python运营分析实践 代码BUG 企业文化 危机管理, 变更执行 可观测性 告警治理 复盘 安全认知 宕机 实践案例 容量不足 思维认知 操作失误 故障复盘 故障治理 故障演练 数据分析 流程规范 混沌工程 稳定性保障 稳定性建设 稳定性治理实践 经验教训 舆情事件

© 2025                 IT 运营管理:ITIL 最佳实践.               粤ICP备2022017430号
本文部分内容摘录于互联网,只做参考学习,若有版权问题请联系处理               viplao@qq.com