故障复盘 25.6.6 :服务瘫痪5小时!阿里云核心域名遭劫持,究竟谁是幕后黑手?
事件经过 ■ 02:57:阿里云监控发现 aliyuncs.com 域名解析出现异常,阿里云工程师正… 继续阅读 故障复盘 25.6.6 :服务瘫痪5小时!阿里云核心域名遭劫持,究竟谁是幕后黑手?
IT 数字化服务运营管理 之 运营的人工智能 (AIOps): 监控、管理、控制
事件经过 ■ 02:57:阿里云监控发现 aliyuncs.com 域名解析出现异常,阿里云工程师正… 继续阅读 故障复盘 25.6.6 :服务瘫痪5小时!阿里云核心域名遭劫持,究竟谁是幕后黑手?
2025年06月13日01时49分(北京时间),谷歌云GCP服务(云计算服务平台),对全球分布式AP… 继续阅读 故障复盘 25.6.13 – 谷歌云故障背后,是什么让 “更新” 变 “灾难”?
故障回顾随着2024年的圆满结束,今天,我有幸与各位一同回顾并深入探讨2024年中出现的一些具有代表… 继续阅读 2024年复盘-互联网十大故障分析回顾
Windows蓝屏致损150亿美元,受灾者仅获赔10美元引热议,程序员激辩用Rust能否改写史上最大… 继续阅读 经验教训 – 2024.7.19 Windows蓝屏致损150亿美元 “黑天鹅”事件引发的思考
腾讯云发布了 4.8 号大故障的复盘报告。我认为是一件好事,因为阿里云双十一大故障的官方故障复盘至今… 继续阅读 经验教训 – 2024.4.8 腾讯云事件持续近87分钟学习经验
网络安全公司CrowdStrike旗下的猎鹰传感器(Falcon Sensor)的一次软件更新引发了… 继续阅读 经验教训 – 24年史上最大规模宕机事件的10个重要教训
11月29日,滴滴出行再就27日夜间系统故障致歉,提出了相应的补救措施和补偿方案。并公布了本次事故的… 继续阅读 经验教训 – 滴滴崩了滴滴官方公布P0级事故原因
时光荏苒,Google 的用户为搜索而来,为免费的 GB Gmail 而去,我们的机群和网络也随之发… 继续阅读 经验教训 – Google 20年的11条运维经验教训
前言2024年还有一个月多一点即将落幕,距离阿里云11.12超级大故障已有13天的时间(传闻故障赔偿… 继续阅读 2023.11.12 阿里云的史诗级故障 故障时长185.76分钟,怎么赔付?
时隔一年阿里云又出大故障,并创造了云计算行业闻所未闻的新记录 —— 全球所有区域/所有服务同时异常。… 继续阅读 故障复盘 – 2023.11.12 阿里云的史诗级故障,从这故障中我们能学到什么