一、演进历史和运维挑战 阿里的实时计算经历了近 10 年的快速发展,总体来说可以分成三大时代: 1.… 继续阅读 运维工具 – 阿里超大规模 Flink 集群运维实践(实时监控必备工具之一)

是不是经常会遇到,有人在群里 @你,告诉你你的系统出故障了,你在犹豫是不是真的出故障的同时还得慌乱地… 继续阅读 实践案例 – B 站 SRE 实践总结了 4 大关键步骤建设监控告警治理