通信技术|亚马逊AWS公布12月7日US-EAST-1服务区域故障原因:网络设备不堪重负

亚马逊网络服务(AWS)已经提供了一个解释,说明是什么原因导致了此前部分服务瘫痪,并且波及大量基于AWS运营的第三方网站和在线平台 。在AWS网站上的一篇文章中,该公司解释说,一个自动程序导致了这次中断,这次中断是12月7日上午10:30从位于北弗吉尼亚的US-EAST-1区域开始 。

通信技术|亚马逊AWS公布12月7日US-EAST-1服务区域故障原因:网络设备不堪重负
文章图片

通信技术|亚马逊AWS公布12月7日US-EAST-1服务区域故障原因:网络设备不堪重负
文章图片

"拥堵的高峰使该公司的运营团队无法使用其实时监控系统,一个自动化的活动来扩展托管在AWS主网络中的一个AWS服务的容量,引发了内部网络内大量客户的意外行为,"亚马逊的报告说 。"这导致了大量的连接活动激增,使内部网络和AWS主网络之间的网络设备不堪重负,导致这些网络之间的通信出现延迟 。"
这个问题甚至严重到影响了亚马逊技术人员查看系统到底出了什么问题的能力 。它使该公司的运营团队无法使用他们通常依赖的实时监控系统和内部控制,这也解释了为什么这次中断需要这么长时间才能修复 。亚马逊指出,AWS服务直到当日的美东时间4点34分才开始改善,问题在美东时间5点22分完全解决 。
【通信技术|亚马逊AWS公布12月7日US-EAST-1服务区域故障原因:网络设备不堪重负】由于亚马逊的支持联络中心也在AWS网络上运行,客户在故障期间有长达七个小时无法创建支持案例 。亚马逊的服务健康仪表板(该平台用来提供状态更新)也受到影响,这也导致亚马逊无法确认故障情况因而延迟承认存在问题 。该公司表示,它正在研究如何改进其对故障的反应,并计划发布服务健康仪表板的改进版,如果发生故障,可以更加及时帮助客户及时收到更新 。
除了像Venmo、Tinder、Disney Plus、甚至Roomba这样的流行服务被中断外,12月7日的故障还波及亚马逊自家物流,让送货工作暂停 。亚马逊在去年的大约这个时候也经历了一次重大故障,导致一些网站和应用程序瘫痪了几个小时 。
访问:
阿里云 - 最高1888元通用代金券立即可用
相关文章:
亚马逊云计算部门遭遇大面积故障 Netflix、Coinbase等受影响
亚马逊云计算突发故障 多家视频网站及自家快递业务瘫痪

    推荐阅读