11月12日,阿里云发生大面积故障。
本次阿里云故障事件,
可能是阿里云发布以来最大的技术事故。
“淘宝又崩了”、“闲鱼崩了”、“阿里云盘崩了”,“钉钉崩了”,
等话题相继登上微博热搜。
事件发生的原因
对于本次故障发生的原因,
阿里云官方的回应是:
“由于阿里云icon杭州地域网络抖动”所导致。
网络抖动这个词是什么意思呢?
不清楚这个的具体是谁发明的,
大家可以理解为“相关部门”。
本人混迹互联网行业多年,
印象中,这个词大概率也是阿里人发明的。
根据技术圈子里的小道消息,
具体原因是:
17:50阿里云已确认故障原因与某个底层服务组件有关。
这个底层服务是Cloudflare。
Cloudflare崩,导致OpenAPI崩,再导致阿里云崩,连锁反应。
上个月,也就是10月23日,
阿里旗下的产品“语雀”也发生了“P0”级事故,
导致平台无法正常访问和使用,
持续了近8个小时(14时10分至21时45分左右)
本次事故的表象是技术故障,
但是维护系统的始终还是人。
8月份,阿里以及其他互联网大厂大规模裁撤大龄员工时,
本人就发文,对这种裁撤大龄员工表示了担忧:
本次阿里云大面积故障的深层次原因,
大概率还是由于上一次的大裁员。
判断的依据是:
排除三年疫情,以往阿里双十一活动最鼎盛的时期,
阿里云没有出现故障,
而今年的双十一已经不再鼎盛,
但是阿里云却发生了大面积故障,
并且发生大规模裁员之后。
事件的影响
首先,受影响的一定是阿里云相关员工。
年终奖估计是没有了,
是否扣工资或者大面积3.25就说不准了。
主要相关负责人可能会被裁。
因为事故已经发生,
总得有个交代不是。
其次,阿里将面临客户的损失赔偿。
昨天才发生的故障,
阿里的客户是直接受害人,
造成的经济损失也会是一个巨大的金额。
后续阿里将面临众多客户的经济赔偿诉讼。
第三,阿里云的市场地位可能不保。
国内互联网大厂基本上都有云计算服务,
本次阿里云事故,
是其竞争对手抢客户的绝佳时机。
有句老话:“趁你病,要你命”。
商场如战场,不能有过多的怜悯之心。
如果您觉得本文对您有用,建议收藏;
如果您觉得对您的朋友有帮助,请分享给他们;
如果您能点个赞,那就是对作者最大的支持。