跳转到内容

IT 运营管理:ITIL 最佳实践

IT 数字化服务运营管理 之 运营的人工智能 (AIOps): 监控、管理、控制

2023.11.27滴滴系统崩了 P0级故障?

昨天(11月26日)晚上,不少用户向潮新闻记者帮反映“滴滴系统崩了,还车还不了。” 今天(11月27… 继续阅读 2023.11.27滴滴系统崩了 P0级故障?

  • 发表于: 2023年11月28日 2023年11月28日
  • 作者: viplao
  • 标签: 故障复盘

经验教训 – Google 20年的11条运维经验教训

时光荏苒,Google 的用户为搜索而来,为免费的 GB Gmail 而去,我们的机群和网络也随之发… 继续阅读 经验教训 – Google 20年的11条运维经验教训

  • 发表于: 2023年11月25日 2024年11月1日
  • 作者: viplao
  • 标签: 经验教训

2023.11.12 阿里云的史诗级故障,故障原因曝光

2023年11月12日,双十一刚过,一大片阿里的产品都挂了,来了一波“史诗级”大翻车。 阿里云断网并… 继续阅读 2023.11.12 阿里云的史诗级故障,故障原因曝光

  • 发表于: 2023年11月25日 2023年11月25日
  • 作者: viplao
  • 标签: 故障复盘

阿里云的史诗级故障,缓解了程序员的精神内耗?

在大部分人的认知中,服务器宕机,产品“崩了”这种事故,往往是因为流量太大,短期内访问量达到峰值。 比… 继续阅读 阿里云的史诗级故障,缓解了程序员的精神内耗?

  • 发表于: 2023年11月25日 2023年11月25日
  • 作者: viplao
  • 标签: 故障复盘

2023.11.12 阿里云的史诗级故障 故障时长185.76分钟,怎么赔付?

前言2024年还有一个月多一点即将落幕,距离阿里云11.12超级大故障已有13天的时间(传闻故障赔偿… 继续阅读 2023.11.12 阿里云的史诗级故障 故障时长185.76分钟,怎么赔付?

  • 发表于: 2023年11月25日 2023年11月25日
  • 作者: viplao
  • 标签: 经验教训

3步高效解决问题实践

利用「假设思考」来解决问题的3步流程。通常我们解决问题有2种思考模式:1种是零基思考,就是没有基准的… 继续阅读 3步高效解决问题实践

  • 发表于: 2023年11月25日 2023年11月25日
  • 作者: viplao
  • 标签: 思维认知

故障复盘 – 2023.11.12 阿里云的史诗级故障,从这故障中我们能学到什么

时隔一年阿里云又出大故障,并创造了云计算行业闻所未闻的新记录 —— 全球所有区域/所有服务同时异常。… 继续阅读 故障复盘 – 2023.11.12 阿里云的史诗级故障,从这故障中我们能学到什么

  • 发表于: 2023年11月24日 2023年11月25日
  • 作者: viplao
  • 标签: 故障复盘, 经验教训

稳定性的灯塔:腾讯 SRE 质量运营体系建设实践

本文将从整体角度出发,探讨腾讯 SRE 质量运营体系是如何构建和实践的,以及建设过程中经验和思考,并… 继续阅读 稳定性的灯塔:腾讯 SRE 质量运营体系建设实践

  • 发表于: 2023年10月29日 2023年10月29日
  • 作者: viplao
  • 标签: 思维认知, 故障治理

故障复盘 – 语雀 P0 事故报告,军规红线9个字总结

语雀是什么 语雀是蚂蚁集团内部孵化的一款笔记类工具,友好的 Markdown 支持,丰富的绘图模板、… 继续阅读 故障复盘 – 语雀 P0 事故报告,军规红线9个字总结

  • 发表于: 2023年10月29日 2023年10月29日
  • 作者: viplao
  • 标签: 故障复盘, 经验教训

服务稳定性保障的五大误解

在线服务的稳定性保障一直是运维和技术部门的核心工作之一。但时至今日,这个方向实际仍然有很多基本的概念… 继续阅读 服务稳定性保障的五大误解

  • 发表于: 2023年10月15日 2023年10月15日
  • 作者: viplao

分页

上一页 页码: 1 … 页码: 14 页码: 15 页码: 16 页码: 17 页码: 18 页码: 19 页码: 20 页码: 21 页码: 22 页码: 23 页码: 24 … 页码: 43 下一页

近期文章

  • 未来已来 – 智能工具探索
  • 阿里卓越架构设计方案-高可用高可靠高扩展
  • 云卓越架构:云上网络稳定性建设最佳实践-阿里云(张星) 
  • 银行容错容灾体系建设与实操性演练设计
  • Azure容错架构全面指南:从单点故障到99.99%可用性的蜕变

AI提示词 excel分析 flink sql 基础实践 ITIL最佳实践 Prompt攻略 Python运营分析实践 代码BUG 企业文化 危机管理, 变更执行 可观测性 告警治理 复盘 安全认知 宕机 实践案例 容量不足 思维认知 操作失误 故障复盘 故障治理 故障演练 数据分析 流程规范 混沌工程 稳定性保障 稳定性建设 稳定性治理实践 经验教训 舆情事件

© 2025                 IT 运营管理:ITIL 最佳实践.               粤ICP备2022017430号
本文部分内容摘录于互联网,只做参考学习,若有版权问题请联系处理               viplao@qq.com