据国外媒体消息,2012年圣诞夜(12月24日)专门提供视频流的Netflix服务中断了近20小时,并说明是因Amazon云(AWS)故障而造成的影响,Amazon随后出面解释,因负载均衡服务(Amazon Elastic Load Balancing Service,ELB)的数据误删除引起的。

Amazon ELB从故障到完全恢复的时间为2012年12月24日的中午12点24分到12月25日的12点05分。Amazon说明,该站的开发人员在进行维护时不小心删除了ELB上的状态数据,这些数据是用来管理美国东部的负载均衡器,但当时没未发现,一直到ELB控制盘在呼叫API来管理负载均衡器时不断出现延迟及错误提示才得知,且只有少数的ELB负载均衡器受到影响。

一开始Amazon并未发现出错的原因,而以为是API错误,随后AWS的客户才提交他们在更改负载均衡的设定后性能出现问题,Amazon才发现症结,并回复遗失的ELB数据。

Amazon表示,在最高峰的时候,只有6.8%使用负载均衡器的服务受到影响,因为其他的负载均衡器无法由客户自行扩展或修改而未受波及,AWS团队先进行手动回复受到影响的负载均衡器,随后装回移失的ELB数据。

除了道歉外Amazon给出补救措施,包括提出更严谨的规定以降低ELB状态数据被误删的风险,由此次的经验修改数据恢复流程加快数据恢复速度。



来源:vacloud.cn
全国咨询热线:0769-22321006 零风险购买软件 零风险购买软件 网上在线咨询 关闭
0769-22321006