2023.11.12 阿里云的史诗级故障 故障时长185.76分钟,怎么赔付?
前言
2024年还有一个月多一点即将落幕,距离阿里云11.12超级大故障已有13天的时间(传闻故障赔偿近1亿)。24号收到了来自阿里云的一则赔偿短信(详见下文),赔偿对象为视频点播服务。
然而,尽管阿里云已经开始采取补偿行动,对于受到影响的用户而言,恢复信心可能需要更多时间。故障事件引起的不便和对服务可靠性的担忧,可能需要云服务商通过更强有力的行动和更有效的沟通,来重新赢得用户的信任和支持。
故障赔偿多少?
2023财年阿里云营收达到772.03亿元,月度营收约64.33亿元,从此次故障全球性质来看,AK是基础服务、OSS基本上大部分公司都会使用,保守一点估计35%的用户会有赔偿,30%赔偿用户里有40%月销金额在赔偿范围内,都按最低SLA标准10%赔付,赔付金额近1个亿,占阿里云利润10%,等2024年财报吧。
注:
- 以上赔偿数据是作者预估数据,真实数据以官方为准,2024年财报应该能看出点东西。
- 这里不包括A级别以上客户的赔偿议价权以外的赔付。
故障时长185.76分钟
尽管网上传来的故障时长可能不长,只有一个多小时,然而根据图表显示,视频点播月度SLA可用性仅为99.57%,这意味着在故障期间服务不可用的时长长达185.76分钟。这个数据揭示了故障事件背后更长的影响时间,显示出故障所导致的服务中断实际上比表面看到的时间要长得多。
计算方式:(1-0.9957)x30x24x60=185.76分钟,一个月按30天算,一天24小时,一小时60分钟
怎么赔偿
大客户、超级大客户赔偿
大客户或超级大客户他们有赔偿议价权,因这类客户是阿里云收入的主要来源他们的去留相对来说对云收入有些影响,所以A级以上的客户不止按SLA赔偿还会有额外的赔偿,SLA内的赔偿也远远覆盖不住他们的业务损失金额。
中小型(BC级)客户赔偿
中小型客户占服务用户相对来说多的,这部分用户基本上是按着SLA标准进行赔偿,当然找销售Bettle的除外。
见赔偿短信
【阿里云】尊敬的xxx:您好,非常抱歉阿里云11月12日发生的产品故障对您产生的影响。根据阿里云向您承诺的《服务等级协议》,本次您的SLA赔偿金总额应为973.45元,我们将为您实际发放总额973.45元。您可前往控制台-“SLA赔偿”查看并领取。如您有任何疑问,欢迎联系您的商务经理、拨打400-80-13260转9、或提交工单联系我们。我们再次诚挚地为此次故障道歉。
阿里云后台截图
小微客户赔偿
从以下两个案例来看 SLA受影响小于50元的,统一按着50元赔偿。
案例一:
可以看出阿里云对于赔偿额度小于50元的用户,按50元赔偿,阿里云对微小客户赔偿没有按SLA方式,主要有两点原因:
- 毕竟这部分用户还很年轻还在成长是阿里云的种子用户
- 目前这部分用户体量小迁移他云成本很低,赔偿大于受影响的金额也让小微用户感受到了阿里云的诚意,可能就放弃了迁移的意愿。
总结
当企业面临宕机问题时,往往会发现补偿措施难以与实际损失相匹配。比如,假设拼多多或淘宝宕机5分钟,这短短的时间可能对企业带来巨大的损失。因此,网友们纷纷提议,除了考虑赔偿使用时长和代金券外,也应该纳入“加班费”因素,因为运维和程序员可能不得不加班应对突发故障。
然而,企业更加关心的是如何避免故障的发生。有分析指出,虽然云服务商承诺提供SLA的安全可靠性,但在实际运营中,始终存在着不可忽视的风险。为了降低这种风险,企业可以采取一些措施,比如进行数据备份并定期更新,或者选择多个云服务提供商以分散风险。但这些措施也不是完美的,它们可能会增加企业的成本和复杂性。
值得注意的是,即便采取了各种预防措施,宕机事件仍然可能发生。因此,当事故发生时,如何对企业进行合理的补偿成为了一项非常重要的议题。然而,现实中的赔偿措施往往难以覆盖企业实际遭受的损失,尤其是在计算损失和补偿之间存在巨大鸿沟的情况下。
有人认为,将损失量化是一个复杂而困难的过程。比如,五分钟的宕机可能对电商企业造成多大的经济损失?这涉及到销售额、用户流失、品牌信誉以及后续的影响。对于一些行业来说,宕机时间甚至可能导致市场份额的严重流失,难以用金钱来衡量。
因此,对于企业和云服务商而言,除了赔偿外,更重要的是如何加强故障预防与处理机制。云服务商需要不断提升自身服务的稳定性和可靠性,减少故障发生的可能性;而企业也应该加强自身的应急预案,降低宕机事件对业务的冲击。这样不仅有助于缓解宕机事件带来的损失,也有利于整个行业的稳定与发展。