Анализ сбоя Amazon Web Services: причины и последствия
Крупный сбой в работе Amazon Web Services (AWS), произошедший 20 октября 2025 года, привел к отключению более тысячи веб-сайтов по всему миру, включая популярные сервисы, такие как Reddit, Snapchat, Delta и Zoom. Инцидент подчеркнул растущую хрупкость интернета и его зависимость от крупных облачных провайдеров.
Эксперты отмечают, что централизация в облачной инфраструктуре создает риски. «Когда они выходят из строя, рушится многое из того, на что мы полагаемся», — заявил Дэвид Чоффнес, профессор компьютерных наук и директор Института кибербезопасности и приватности Северо-Восточного университета.
AWS, занимающая 30% рынка облачных вычислений, изначально сообщила о проблемах с задержками и частотой ошибок в своих дата-центрах в Северной Вирджинии. Причиной сбоя оказалась проблема с Системой доменных имен (DNS), затронувшая одну из крупнейших баз данных компании — DynamoDB.
DNS служит для преобразования человекочитаемых имен сайтов, таких как Amazon.com, в числовые IP-адреса, понятные компьютерам. По словам Чоффнеса, «DNS — это, по сути, большая таблица соответствия имен и IP-адресов». Вероятно, запись для базы данных DynamoDB временно исчезла из этой таблицы, что привело к невозможности установить соединение с сервисом.
Устранение таких проблем может быть сложным, учитывая, что многие интернет-сервисы зависят от затронутой базы данных. Сервис Downdetector зафиксировал более 6.5 миллионов сообщений о сбоях в этот день.
Первоначальные заявления AWS о восстановлении систем оказались преждевременными. Несмотря на устранение проблемы с DNS, пользователи продолжали испытывать трудности с доступом, в частности, к Amazon Elastic Cloud Computing (EC2), позволяющей компаниям запускать виртуальные серверы. Чоффнес объясняет это «эффектом домино»: даже после исправления основной причины, сбои в работе зависимых систем могут потребовать перезагрузки и дополнительного времени на восстановление.
Прогнозировать точное время полного восстановления услуг сложно. «Это похоже на игру « whack-a-mole » (бей крота): ты исправляешь одну проблему, думаешь, что все закончилось, а затем этот же фикс вызывает новую проблему», — описывает ситуацию Чоффнес. Сотрудники Amazon, вероятно, работают в непрерывном режиме, устраняя последовательные неполадки.
Комментарии
Комментариев пока нет.