跳转到内容

IT 运营管理:ITIL 最佳实践

IT 数字化服务运营管理 之 运营的人工智能 (AIOps): 监控、管理、控制

故障复盘 :Case Study: 故障复盘通用模版

1. 详细描述(必填) 详细的 bug 描述, 包含可以复现的环境准备(比如测试包、有问题的 com… 继续阅读 故障复盘 :Case Study: 故障复盘通用模版

  • 发表于: 2025年6月14日 2025年6月14日
  • 作者: viplao
  • 标签: 故障复盘

故障复盘 25.6.13 – 谷歌云故障背后,是什么让 “更新” 变 “灾难”?

2025年06月13日01时49分(北京时间),谷歌云GCP服务(云计算服务平台),对全球分布式AP… 继续阅读 故障复盘 25.6.13 – 谷歌云故障背后,是什么让 “更新” 变 “灾难”?

  • 发表于: 2025年6月13日 2025年6月13日
  • 作者: viplao
  • 标签: 故障复盘, 经验教训

系统稳定性建设(21) – 分钟级感知故障、定位和快恢的能力

SRE可观测能力的重要性,强调了分钟级感知故障、定位和快速恢复的能力。通过可观测性建设,SRE能够深… 继续阅读 系统稳定性建设(21) – 分钟级感知故障、定位和快恢的能力

  • 发表于: 2025年5月25日 2025年5月25日
  • 作者: viplao
  • 标签: 稳定性建设

系统稳定性建设(20)- AI怎么将系统稳定性拉满?

如何通过腾讯云顾问来提升系统稳定性。首先,通过云生图功能生成项目的全局架构图,并进行手动绘制,使得架… 继续阅读 系统稳定性建设(20)- AI怎么将系统稳定性拉满?

  • 发表于: 2025年5月25日 2025年5月25日
  • 作者: viplao
  • 标签: 稳定性建设

系统稳定性建设(19)架构优化的关键策略实践

一、作者在阿里巴巴的工作经验,并分享了稳定性保障和架构优化的核心策略。视频首先分析了系统故障的原因和… 继续阅读 系统稳定性建设(19)架构优化的关键策略实践

  • 发表于: 2025年5月25日 2025年5月25日
  • 作者: viplao
  • 标签: 稳定性建设

系统稳定性建设(18) – 高可用原则与设计

可靠性设计工作应遵循以下几个原则。□应将产品的可靠性要求转化为可考核验证的设计要求,作为可靠性设计的… 继续阅读 系统稳定性建设(18) – 高可用原则与设计

  • 发表于: 2025年5月18日 2025年5月25日
  • 作者: viplao
  • 标签: 稳定性建设

系统稳定性建设(16) – 稳定架构设计思路

系统稳定性建设是系统工程的核心内容之一。以下是一些重要的方面: 架构设计:采用模块化、松耦合的架构设… 继续阅读 系统稳定性建设(16) – 稳定架构设计思路

  • 发表于: 2025年3月23日 2025年3月23日
  • 作者: viplao
  • 标签: 稳定性建设

系统稳定性建设(15) – 各大互联网公司稳定性治理之线上故障处理

0x01 概述 0x02 线上故障处理的目标 线上故障处理的过程也一样,优先级从高到低,线上故障处理… 继续阅读 系统稳定性建设(15) – 各大互联网公司稳定性治理之线上故障处理

  • 发表于: 2025年3月23日 2025年3月23日
  • 作者: viplao
  • 标签: 稳定性建设

系统稳定性建设(14) – 稳定性治理思路与实践

想了想,还是把过往一段时间里,我们在稳定性建设中的实践记录下来,包含一些思路和方法,也算是一部大型踩… 继续阅读 系统稳定性建设(14) – 稳定性治理思路与实践

  • 发表于: 2025年3月22日 2025年3月22日
  • 作者: viplao
  • 标签: 稳定性建设

系统稳定性建设(13) – AI赋能稳定性思路

在当今数字化时代,从云端服务到智能工厂,从金融交易系统到医疗信息系统,各种复杂系统如同现代社会的“神… 继续阅读 系统稳定性建设(13) – AI赋能稳定性思路

  • 发表于: 2025年3月22日 2025年3月22日
  • 作者: viplao
  • 标签: 稳定性建设

分页

上一页 页码: 1 页码: 2 页码: 3 页码: 4 页码: 5 页码: 6 页码: 7 页码: 8 页码: 9 页码: 10 页码: 11 … 页码: 45 下一页

近期文章

  • 稳定性建设体系 – 故障应急案例学习
  • 稳定性建设体系 – 故障处理案例学习
  • 稳定性建设体系 – 容量管理案例学习
  • 稳定性建设 – 混沌工程案例学习
  • 稳定性建设体系 – 架构优化案例学习

AI提示词 excel分析 flink sql 基础实践 ITIL最佳实践 Prompt攻略 Python运营分析实践 代码BUG 企业文化 危机管理, 变更执行 可观测性 告警治理 复盘 安全认知 宕机 实践案例 容量不足 思维认知 操作失误 故障复盘 故障治理 故障演练 数据分析 流程规范 混沌工程 稳定性保障 稳定性建设 稳定性治理实践 经验教训 舆情事件

© 2025                 IT 运营管理:ITIL 最佳实践.               粤ICP备2022017430号
本文部分内容摘录于互联网,只做参考学习,若有版权问题请联系处理               viplao@qq.com