跳转到内容

IT 运营管理:ITIL 最佳实践

IT 数字化服务运营管理 之 运营的人工智能 (AIOps): 监控、管理、控制

经验教训标签存档订阅

故障复盘 25.6.6 :服务瘫痪5小时!阿里云核心域名遭劫持,究竟谁是幕后黑手?

事件经过 ■ 02:57:阿里云监控发现 aliyuncs.com 域名解析出现异常,阿里云工程师正… 继续阅读 故障复盘 25.6.6 :服务瘫痪5小时!阿里云核心域名遭劫持,究竟谁是幕后黑手?

  • 发表于: 2025年6月14日 2025年6月14日
  • 作者: viplao
  • 标签: 故障复盘, 经验教训

故障复盘 25.6.13 – 谷歌云故障背后,是什么让 “更新” 变 “灾难”?

2025年06月13日01时49分(北京时间),谷歌云GCP服务(云计算服务平台),对全球分布式AP… 继续阅读 故障复盘 25.6.13 – 谷歌云故障背后,是什么让 “更新” 变 “灾难”?

  • 发表于: 2025年6月13日 2025年6月13日
  • 作者: viplao
  • 标签: 故障复盘, 经验教训

2024年复盘-互联网十大故障分析回顾

故障回顾随着2024年的圆满结束,今天,我有幸与各位一同回顾并深入探讨2024年中出现的一些具有代表… 继续阅读 2024年复盘-互联网十大故障分析回顾

  • 发表于: 2025年1月4日 2025年1月4日
  • 作者: viplao
  • 标签: 故障复盘, 经验教训

经验教训 – 2024.7.19 Windows蓝屏致损150亿美元 “黑天鹅”事件引发的思考

Windows蓝屏致损150亿美元,受灾者仅获赔10美元引热议,程序员激辩用Rust能否改写史上最大… 继续阅读 经验教训 – 2024.7.19 Windows蓝屏致损150亿美元 “黑天鹅”事件引发的思考

  • 发表于: 2024年10月20日 2024年10月20日
  • 作者: viplao
  • 标签: 故障复盘, 经验教训

经验教训 – 2024.4.8 腾讯云事件持续近87分钟学习经验

腾讯云发布了 4.8 号大故障的复盘报告。我认为是一件好事,因为阿里云双十一大故障的官方故障复盘至今… 继续阅读 经验教训 – 2024.4.8 腾讯云事件持续近87分钟学习经验

  • 发表于: 2024年10月20日 2024年10月20日
  • 作者: viplao
  • 标签: 故障复盘, 经验教训

经验教训 – 24年史上最大规模宕机事件的10个重要教训

网络安全公司CrowdStrike旗下的猎鹰传感器(Falcon Sensor)的一次软件更新引发了… 继续阅读 经验教训 – 24年史上最大规模宕机事件的10个重要教训

  • 发表于: 2024年10月13日 2024年10月13日
  • 作者: viplao
  • 标签: 经验教训

经验教训 – 滴滴崩了滴滴官方公布P0级事故原因

11月29日,滴滴出行再就27日夜间系统故障致歉,提出了相应的补救措施和补偿方案。并公布了本次事故的… 继续阅读 经验教训 – 滴滴崩了滴滴官方公布P0级事故原因

  • 发表于: 2023年11月30日 2023年11月30日
  • 作者: viplao
  • 标签: 经验教训

经验教训 – Google 20年的11条运维经验教训

时光荏苒,Google 的用户为搜索而来,为免费的 GB Gmail 而去,我们的机群和网络也随之发… 继续阅读 经验教训 – Google 20年的11条运维经验教训

  • 发表于: 2023年11月25日 2024年11月1日
  • 作者: viplao
  • 标签: 经验教训

2023.11.12 阿里云的史诗级故障 故障时长185.76分钟,怎么赔付?

前言2024年还有一个月多一点即将落幕,距离阿里云11.12超级大故障已有13天的时间(传闻故障赔偿… 继续阅读 2023.11.12 阿里云的史诗级故障 故障时长185.76分钟,怎么赔付?

  • 发表于: 2023年11月25日 2023年11月25日
  • 作者: viplao
  • 标签: 经验教训

故障复盘 – 2023.11.12 阿里云的史诗级故障,从这故障中我们能学到什么

时隔一年阿里云又出大故障,并创造了云计算行业闻所未闻的新记录 —— 全球所有区域/所有服务同时异常。… 继续阅读 故障复盘 – 2023.11.12 阿里云的史诗级故障,从这故障中我们能学到什么

  • 发表于: 2023年11月24日 2023年11月25日
  • 作者: viplao
  • 标签: 故障复盘, 经验教训

分页

页码: 1 页码: 2 页码: 3 页码: 4 下一页

近期文章

  • 【PYTHON10年经验总结】电商平台销售数据分析实践 -实践前自动生成数据集
  • 【Python10年经验总结】第九课 电商平台销售数据分析实践 -数据可视化(Data Visualization)
  • 【Python10年经验总结】第八课 电商平台销售数据分析实践 -机器学习预测(Machine Learning Forecasting)
  • 【Python10年经验总结】第七课 电商平台销售数据分析实践 -时间序列分析(Time Series Analysis)
  • 【Python10年经验总结】第六课 电商平台销售数据分析实践 – 分析结果(Analysis Insights)

AI提示词 excel分析 flink sql 基础实践 ITIL最佳实践 Prompt攻略 Python运营分析实践 代码BUG 企业文化 危机管理, 变更执行 可观测性 告警治理 复盘 安全认知 宕机 实践案例 容量不足 思维认知 操作失误 故障复盘 故障治理 故障演练 数据分析 流程规范 混沌工程 稳定性保障 稳定性建设 稳定性治理实践 经验教训 舆情事件

© 2025                 IT 运营管理:ITIL 最佳实践.               粤ICP备2022017430号
本文部分内容摘录于互联网,只做参考学习,若有版权问题请联系处理               viplao@qq.com