经验教训 – 3.29 #微信QQ出现功能异常#,冲上热搜,妥妥的第一


包括微信语音、账号登录、朋友圈,以及微信支付,都无法正常使用。



有网友表示,电脑版微信大概是在早上10:00左右恢复登录,和小雷登录的时间相吻合。


据腾讯的最新财报显示,微信及WECHAT月活数高达13.1亿,如此大用户量的产品出现故障无疑对大众生活工作带来了不少的影响。




不过有一说一,大厂们服务器故障,似乎每年都得上演那么几次。
轻微一些的,有像B站前阵子那样,视频短暂崩溃了半小时。
严重点的,就有像这次微信QQ接连异常,影响到上亿用户正常使用。
可是问题来喽,微信和QQ不是独立运营的吗?怎么微信异常,还能牵连到QQ捏?
在各大论坛逛了一圈后,可发现,问题就出在腾讯云服务器身上。
微信和QQ的联网,主要依赖于腾讯自家的“腾讯云”,这个属于行业惯例了。
像是阿里的淘宝闲鱼,也会把用户数据放在自家阿里云上运行。
但就在今天凌晨两点左右,腾讯云服务器直接崩了…
当时的情况是,腾讯云的CVM、COS和CDN服务都加载不出来,连在线客服的接口都挂了。
底层的服务器出了问题,搭建于云上的微信和QQ,自然难以幸免。
刷不出朋友圈、图片加载慢等等,对咱们来说,顶多是暂时无聊一阵子。
但对于很多依赖腾讯云来展开业务的企业来说,这波损失的可都是真金白银…
至于腾讯云为啥突然炸了,得到的小道消息是,机房的冷源系统出问题了。
导致需要维持散热的服务器集群,热得全部宕机。
不仅影响到腾讯QQ,网站和App都放在腾讯云的唯品会也中招(信息来源于网络,不一定真实)

宕机问题不大,最怕数据没了

当然啦,数据没有丢失已经是不幸中的万幸。
回顾过往的大厂服务器“炸裂”案例,有一些大厂因为天灾或被黑客攻击,导致服务器数据直接丢失。
比较出名的,就有2011年的“索尼PlayStation Network”事件。
当时索尼PS游戏机的网络服务,被黑客精准打击,导致7700万用户信息和信用卡信息泄露。
而索尼为了加强防御措施,直接把游戏服务器关停了一个月,玩家们人都麻了.
2021年11月3日,多款网易游戏出现无法登录、断连情况。
据《绝对演绎》等游戏官博表示原因系机房过热导致服务器宕机“机房传来报警,温度过高。部分服务器过热宕机。空调重新开机也没有解决问题……”。
事发后约3小时左右,网易游戏各服务器已恢复正常登陆,网易方面并未就此次故障做统一回复。
看看阿里的教验建议:经验教训 – 狡兔务必三窟:阿里云香港可用区C宕机血的教训与反思
转自:https://view.inews.qq.com/a/20230329A0A30F00