微软在美国服务于周五上午清晨约6点突然无预警大宕机,造成包含微软旗下的众多服务,包括M365和Azure云计算服务均受影响。不仅影响了美国多架航班的停飞和延误,也对使用其服务的企业造成了影响。尽管这次服务中断主要发生在美国,但在台湾,今天下午也有不少网友上网抱怨无法正常使用微软的系统和服务,影响其正常工作。

这次服务中断事故主要发生在世界标准时间(UTC)7月18日21点56分(为7月19日早上5点56分),微软位于美国中部区域一座Azure数据中心出现故障问题,导致包含M365在内等云计算服务大中断,无法正常提供服务。已知受影响服务包含了M365管理中心、线上版SharePoint、商用版OneDrive、Teams、Intune、PowerBI、Fabric、Defender、Defender for Endpoint、Viva Engage。

中断事故发生后,微软也在Azure状态页面公告指出,因为美国中部地区的多个Azure服务中遇到问题,造成服务管理作业、服务连接或可用性故障。

微软在发现问题后也展开行动加以解决。但在服务中断期间,许多依赖微软服务的企业受到影响。例如,不少美国航空企业的航班受到了影响,包括Frontier的运营受到了短暂影响,SunCountry的预订和入住设施也因第三方供应商使用微软服务而受到影响,此外,Allegiant的网站也暂时无法使用。

截至世界标准时间7月19日1点30点(服务中断3小时后),微软表示,已采取缓解策略,将原有服务流量重定向其他正常运行的数据中心,并表示目前旗下服务正在逐渐恢复中。

微软调查造成服务中断的主因,是因为后端集群管理工作流程部署设置被更改,导致Azure存储集群与计算资源之间的后端访问被封锁,当虚拟磁盘无法连接时,会自动重新启动计算资源,因而造成其服务中断。微软表示,目前该区域所有Azure存储集群均已得到缓解,大部分服务已恢复正常。

截至05点30分,微软公告美国中部地区已恢复正常运营。但M365服务仍处于中断的状态,部分用户无法使用其中许多服务。