跳转到内容

IT 运营管理:ITIL 最佳实践

IT 数字化服务运营管理 之 运营的人工智能 (AIOps): 监控、管理、控制

viplao

404站点RSS订阅

viplao 的帖子

故障复盘 25.6.6 :服务瘫痪5小时!阿里云核心域名遭劫持,究竟谁是幕后黑手?

事件经过 ■ 02:57:阿里云监控发现 aliyuncs.com 域名解析出现异常,阿里云工程师正… 继续阅读 故障复盘 25.6.6 :服务瘫痪5小时!阿里云核心域名遭劫持,究竟谁是幕后黑手?

  • 发表于: 2025年6月14日 2025年6月14日
  • 作者: viplao
  • 标签: 故障复盘, 经验教训

故障复盘 :Case Study: 故障复盘通用模版

1. 详细描述(必填) 详细的 bug 描述, 包含可以复现的环境准备(比如测试包、有问题的 com… 继续阅读 故障复盘 :Case Study: 故障复盘通用模版

  • 发表于: 2025年6月14日 2025年6月14日
  • 作者: viplao
  • 标签: 故障复盘

故障复盘 25.6.13 – 谷歌云故障背后,是什么让 “更新” 变 “灾难”?

2025年06月13日01时49分(北京时间),谷歌云GCP服务(云计算服务平台),对全球分布式AP… 继续阅读 故障复盘 25.6.13 – 谷歌云故障背后,是什么让 “更新” 变 “灾难”?

  • 发表于: 2025年6月13日 2025年6月13日
  • 作者: viplao
  • 标签: 故障复盘, 经验教训

系统稳定性建设(21) – 分钟级感知故障、定位和快恢的能力

SRE可观测能力的重要性,强调了分钟级感知故障、定位和快速恢复的能力。通过可观测性建设,SRE能够深… 继续阅读 系统稳定性建设(21) – 分钟级感知故障、定位和快恢的能力

  • 发表于: 2025年5月25日 2025年5月25日
  • 作者: viplao
  • 标签: 稳定性建设

系统稳定性建设(20)- AI怎么将系统稳定性拉满?

如何通过腾讯云顾问来提升系统稳定性。首先,通过云生图功能生成项目的全局架构图,并进行手动绘制,使得架… 继续阅读 系统稳定性建设(20)- AI怎么将系统稳定性拉满?

  • 发表于: 2025年5月25日 2025年5月25日
  • 作者: viplao
  • 标签: 稳定性建设

系统稳定性建设(19)架构优化的关键策略实践

一、作者在阿里巴巴的工作经验,并分享了稳定性保障和架构优化的核心策略。视频首先分析了系统故障的原因和… 继续阅读 系统稳定性建设(19)架构优化的关键策略实践

  • 发表于: 2025年5月25日 2025年5月25日
  • 作者: viplao
  • 标签: 稳定性建设

系统稳定性建设(18) – 高可用原则与设计

可靠性设计工作应遵循以下几个原则。□应将产品的可靠性要求转化为可考核验证的设计要求,作为可靠性设计的… 继续阅读 系统稳定性建设(18) – 高可用原则与设计

  • 发表于: 2025年5月18日 2025年5月25日
  • 作者: viplao
  • 标签: 稳定性建设

系统稳定性建设(16) – 稳定架构设计思路

系统稳定性建设是系统工程的核心内容之一。以下是一些重要的方面: 架构设计:采用模块化、松耦合的架构设… 继续阅读 系统稳定性建设(16) – 稳定架构设计思路

  • 发表于: 2025年3月23日 2025年3月23日
  • 作者: viplao
  • 标签: 稳定性建设

系统稳定性建设(15) – 各大互联网公司稳定性治理之线上故障处理

0x01 概述 0x02 线上故障处理的目标 线上故障处理的过程也一样,优先级从高到低,线上故障处理… 继续阅读 系统稳定性建设(15) – 各大互联网公司稳定性治理之线上故障处理

  • 发表于: 2025年3月23日 2025年3月23日
  • 作者: viplao
  • 标签: 稳定性建设

系统稳定性建设(14) – 稳定性治理思路与实践

想了想,还是把过往一段时间里,我们在稳定性建设中的实践记录下来,包含一些思路和方法,也算是一部大型踩… 继续阅读 系统稳定性建设(14) – 稳定性治理思路与实践

  • 发表于: 2025年3月22日 2025年3月22日
  • 作者: viplao
  • 标签: 稳定性建设

分页

上一页 页码: 1 页码: 2 页码: 3 页码: 4 页码: 5 页码: 6 页码: 7 … 页码: 41 下一页

近期文章

  • 【PYTHON10年经验总结】电商平台销售数据分析实践 -实践前自动生成数据集
  • 【Python10年经验总结】第九课 电商平台销售数据分析实践 -数据可视化(Data Visualization)
  • 【Python10年经验总结】第八课 电商平台销售数据分析实践 -机器学习预测(Machine Learning Forecasting)
  • 【Python10年经验总结】第七课 电商平台销售数据分析实践 -时间序列分析(Time Series Analysis)
  • 【Python10年经验总结】第六课 电商平台销售数据分析实践 – 分析结果(Analysis Insights)

AI提示词 excel分析 flink sql 基础实践 ITIL最佳实践 Prompt攻略 Python运营分析实践 代码BUG 企业文化 危机管理, 变更执行 可观测性 告警治理 复盘 安全认知 宕机 实践案例 容量不足 思维认知 操作失误 故障复盘 故障治理 故障演练 数据分析 流程规范 混沌工程 稳定性保障 稳定性建设 稳定性治理实践 经验教训 舆情事件

© 2025                 IT 运营管理:ITIL 最佳实践.               粤ICP备2022017430号
本文部分内容摘录于互联网,只做参考学习,若有版权问题请联系处理               viplao@qq.com