viplao 的帖子
ITIL实践案例 – ITIL在IBM项目实施经验
实践案例 – 预案管理 故障预案6板斧
故障处理trouble shooting是每个SRE要做的日常,特别是处在快速成长期的大型互联网系统… 继续阅读 实践案例 – 预案管理 故障预案6板斧
实践案例 – 告警定级为告警治理核心,告警智能定级原理探索
很多大规模复杂在线服务系统,比如 Google、Amazon、Microsoft 和大型商业银行,包… 继续阅读 实践案例 – 告警定级为告警治理核心,告警智能定级原理探索
实践案例 – B 站 SRE 实践总结了 4 大关键步骤建设监控告警治理
是不是经常会遇到,有人在群里 @你,告诉你你的系统出故障了,你在犹豫是不是真的出故障的同时还得慌乱地… 继续阅读 实践案例 – B 站 SRE 实践总结了 4 大关键步骤建设监控告警治理
实践案例 – 腾讯织云智能监控实践
监控系统经历大数据转型后迎来 AI 浪潮。这个主题分享腾讯织云监控的演进过程和考量因素。结合实际案例… 继续阅读 实践案例 – 腾讯织云智能监控实践
实践案例 – 苏宁 AI 监控运维保障建设实践
建设背景 近些年,苏宁一直基于云技术对外提供服务、产品、内容和应用。随着苏宁线上业务不断扩张,业务量… 继续阅读 实践案例 – 苏宁 AI 监控运维保障建设实践
实践案例 – 美团点评实时计算平台的 Flink 监控与告警实践
为什么我们关注指标监控 以天气为例。 指标:衡量和描述对象的方式 可量化:比如最近天气很热。今天比昨… 继续阅读 实践案例 – 美团点评实时计算平台的 Flink 监控与告警实践
实践案例 – 苏宁基于 ClickHouse 的大数据全链路监控实践
简介 ClickHouse 是一款优秀的 OLAP 分析引擎,尤其是在单表分析 、Colocate … 继续阅读 实践案例 – 苏宁基于 ClickHouse 的大数据全链路监控实践
实践案例 – 货拉拉全链路监控体系的落地与实践
今天分享的主题是货拉拉全链路监控体系的落地与实践,以下是分享大纲。 分享大纲 一、监控演进史 1、行… 继续阅读 实践案例 – 货拉拉全链路监控体系的落地与实践