Amazon опубликовала отчет, подробно описывающий крупный сбой 20 октября, который затронул многочисленные веб-сайты и сервисы. Инцидент возник из-за ошибки в DynamoDB, сервисе хранения данных Amazon для клиентов AWS. Эта ошибка привела к появлению пустой DNS-записи для дата-центров Amazon в Северной Вирджинии. DynamoDB, который обычно автоматически обрабатывает такие проблемы, не смог решить проблему самостоятельно. В результате Amazon пришлось вмешаться и устранить проблему вручную. В это время все системы, зависящие от DynamoDB, испытывали сбои DNS. Этот широкомасштабный сбой затронул многие собственные сервисы Amazon, включая Alexa, а также многочисленные сторонние сервисы. Среди пострадавших были такие сервисы, как Bank of America, Snapchat, Reddit и игровые платформы, такие как Fortnite. Некоторые пользователи столкнулись с медленными ответами, в то время как другие обнаружили, что сервисы полностью недоступны. Amazon принесла извинения за последствия и обязалась извлечь уроки из этого события для повышения доступности сервисов.
engadget.com
Amazon says automation bug caused massive AWS outage
Create attached notes ...
