稳定性建设体系 – 故障应急案例学习
业务系统故障率居高不下:有哪些非常有效的治理大招?美图SRE:一次线上大事故,我悟出了故障治理的3步… 继续阅读 稳定性建设体系 – 故障应急案例学习
IT 数字化服务运营管理 之 运营的人工智能 (AIOps): 监控、管理、控制
业务系统故障率居高不下:有哪些非常有效的治理大招?美图SRE:一次线上大事故,我悟出了故障治理的3步… 继续阅读 稳定性建设体系 – 故障应急案例学习
B站故障应急与业务1-5-10摸排:如何实现超95%故障自发现率?故障总时长从100+分钟到低于30… 继续阅读 稳定性建设体系 – 故障处理案例学习
业务增长挑战:去哪儿如何通过自动化高效管理Redis,实现资源快速交付?半年减少70%PAAS层配置… 继续阅读 稳定性建设体系 – 容量管理案例学习
100+次演练验证:酷家乐如何打造高效的自动化演练平台? 2个月演练200+次:B站如何实现演练平台… 继续阅读 稳定性建设 – 混沌工程案例学习
亿级流量下的高可用实践:携程门票秒杀架构如何设计? 去哪儿“技术债”偿还实践:如何高效、低风险砍掉5… 继续阅读 稳定性建设体系 – 架构优化案例学习
故障预警准确率超90%:去哪儿网秒级监控做了哪些改造?B站监控2.0架构升级:P90查询性能如何提升… 继续阅读 稳定性建设体系 – 监控告警案例学习
以下这些文章的核心思想是:稳定性不仅依赖技术,更依赖于组织文化、流程规范和人员管理。 单纯的技术手段… 继续阅读 稳定性建设体系 – 流程规范案例学习
我们来创建一个针对电商平台日志数据时序预测程序。这个程序将模拟生成包含访问量(如PV或UV)的时序日… 继续阅读 【Python实践案例】电商平台数据分析和挖掘 – 时序预测
开发思路:我们来创建一个Python脚本,用于演示如何为电商平台的不同监控指标类型(例如:CPU使用… 继续阅读 【Python实践案例】电商平台数据分析和挖掘 – 动态告警阈值预测
该脚本将包含以下功能:使用随机森林(Random Forest)进行有监督的欺诈检测