Службы Amazon Web Services (AWS), предлагающие многим крупным интернет-компаниям хостинг, мощности центров обработки данных, резервные хранилища и массу других облачных возможностей, уже третий день испытывают трудности после серьёзного сбоя инфраструктуры в одном из 5 регионов.
Нарушение функциональности центров обработки данных на восточном побережье США произошло в пятницу и привело к проблемам или полному прекращению работоспособности многих известных сайтов, таких как Quora, Sencha, Reddit и FourSquare, а также служб, основанных на Heroku. Была нарушена работоспособность служб Amazon Elastic Compute Cloud, Relational Database Service и Elastic Beanstalk. И хотя сейчас практически все тома EBS восстановлены, многие компании понесли большой ущерб и наверняка задумаются о том, насколько надёжными являются AWS.
Amazon предлагает своим клиентам 5 регионов для размещения данных, в каждом из которых есть несколько совершенно независимых зон доступности. Amazon обещает, что дублирование информации в нескольких зонах доступности внутри одного региона почти полностью избавляет от возможных проблем, будь то сбой в центре обработки данных или внешние факторы. В теории проблемы функционирования сразу нескольких зон доступности в одном регионе практически исключены, если не учитывать стихийные бедствия или другие масштабные катастрофы. Руководствуясь обещаниями Amazon, большинство компаний-пользователей AWS размещают резервные копии в различных зонах доступности внутри одного региона, не прибегая к дублированию данных в разных регионах, связь между которыми относительно медленная.
Однако в реальности произошло то, что почти невероятно, если структура служб AWS соответствует заявленным характеристикам: сбилось сразу несколько зон доступности на восточном побережье США по внутренним техническим причинам. В полностью независимых центрах обработки данных это невозможно, следовательно, зоны доступности AWS в одном регионе имеют некую общую точку сбоя. Есть повод задуматься клиентам Amazon.
При этом AWS является одним из лидеров в области облачных вычислений, предлагая гибкие средства подключения, инфраструктуру с простыми возможностями расширения и широкую функциональность.
Происшедшая катастрофа не только потребует от Amazon существенных затрат на восстановление, но и, скорее всего, приведёт к компенсационным выплатам пострадавшим клиентам. К тому же, столь серьёзный сбой наверняка уменьшит доверие к AWS. С другой стороны, данный инцидент позволит Amazon и другим компаниям принять меры, чтобы избежать подобных сценариев в будущем.
Источник: 3DNews
|