Проверка на прочность – готовим дата-центр к ураганам и смерчам

2 июля 2013

Проверка на прочностьКак обезопасить центр обработки данных от ущерба в результате торнадо, ураганов и бурь? На самом деле это очень непростой вопрос. И касается рассматриваемая проблема операторов ЦОД со всего мира: в США в самом разгаре сезон ураганов, по центральной части Европы проносятся разрушительные бури, в России подобных проблем тоже хватает. Чтобы найти ответ на поставленный выше вопрос, необходимо заняться изучением норм проектирования критически важных объектов.

По словам экспертов, при желании мы вполне можем спроектировать и построить объект, способный выдержать все, что угодно. Все сводится к тому, сколько мы хотим и можем потратить. Необходимо также тщательно проанализировать все преимущества и недостатки размещения вычислительных мощностей в регионе, который характеризуется повышенным риском подобных природных катаклизмов.

Представьте, что у вас есть возможность построить ЦОД в регионе с высоким спросом на вычислительные мощности и высоким риском стихийных бедствий. У вас есть два варианта: потратить дополнительные деньги, чтобы построить свой дата-центр предельно близко к целевой аудитории, или возвести здание в относительно безопасном месте в ущерб задержкам, что может обернуться снижением числа потенциальных клиентов.

Примечательно, что в США администрации некоторых штатов предлагают застройщикам финансовые стимулы, дабы компенсировать дополнительное повышение структурной прочности возводимого объекта, который после этого сможет противостоять торнадо категории F5 (скорость ветра 419—512 км/ч). Подобные программы стимулирования применяются и в других странах. Все это необходимо учитывать при анализе рисков и совокупной стоимости владения, чтобы принять обоснованное решение и развивать свой бизнес в верном направлении.

SunGard предлагает систему раннего оповещения

Аптайм во время шторма достигается не только благодаря нагромождению цемента и стали – необходима продуманная политика безопасности и строго регламентированные процедуры на случай подобных катаклизмов. В случае быстродвижущихся бурь механизмы раннего предупреждения могут иметь ключевое значение для успешной реализации этих процедур.

Подобные задачи зачастую ложатся на плечи национальных метеорологических организаций, но во многих государствах им на помощь приходят и частные компании, профиль бизнеса которых зачастую никак не связан с метеорологией. Например, в североамериканском государстве есть компания SunGard Availability Services, специалисты которой создали продвинутую систему раннего оповещения о погодных катаклизмах.

В этой системе используются данные, поступающие в режиме реального времени от Национального управления океанических и атмосферных исследований США (National Oceanic and Atmospheric Administration; NOAA) и ряда других региональных метеорологических организаций. В основе технологии лежит передовой механизм анализа больших данных. Данный продукт позволяет компании SunGard Availability Services, специализирующейся на предоставлении IT-услуг, держать своих клиентов в курсе угрожающих их бизнесу штормов и других стихийных бедствий.

«Многие компании хотят во что бы то ни стало сохранить непрерывность бизнес-процессов во время сильных штормов. Но в большинстве случаев их инициативы терпят крах просто потому, что специалисты не готовы к приходу катаклизма», сказал Боб Дилосси, эксперт SunGard Availability Services по управлению в кризисных ситуациях. «На протяжении многих лет мы прислушивались к предложениям со стороны наших клиентов, и мы гордимся тем, что оказались одним из первых провайдеров IT-услуг, предлагающих систему метеопредупреждения абсолютно бесплатно – в довесок к стандартным сервисам. Использование информации о погоде в режиме реального времени в сочетании с бизнес-аналитикой позволяет нам подготовить своих клиентов к наихудшему. Так у них появляется время, чтобы все тщательно спланировать и принять необходимые меры «.

Насколько прочным должно быть строение?

Эксперты утверждают, что многие современные дата-центры способны выдержать скорость ветра в 240 километров в час, что соответствует торнадо категории F3 по шкале Фудзиты. Но это крайне мало, учитывая участившиеся случаи возникновения смерчей категории F5 (один из таких недавно обрушился на Оклахому). Но даже несмотря на рост числа подобных катаклизмов, вреда от них намного меньше, чем от ураганов или землетрясений. Ураганы и землетрясения могут повредить инфраструктуру на огромных участках земли, в то время как торнадо способны вызвать серьезные повреждения на площади всего в несколько квадратных километров. Девяносто пять процентов торнадо имеют категорию ниже F3, и только 0.1 процент соответствует F5. И большее всего они угрожают не самому зданию ЦОД, а его инфраструктуре: катаклизм может обернуться перебоями в подаче электроэнергии, неполадками на линиях связи и наводнениям.

Урон неизбежен в любом случае. Несмотря на это, есть застройщики, которые позиционируют свои ЦОД как «торнадостойкие». И в некоторых случаях объекты, как ни странно, таковыми и являются. Например, компания Perimeter Technology построила свой новый центр обработки данных в богатой на торнадо Оклахоме. Фальшпол внутри этого ЦОД окружен 22-сантиметровыми железобетонными стенами, те, в свою очередь, окружены офисами, которые также защищены 22-сантиметровым бетоном наружной стены. Усиленная крыша здания очень толстая и может справиться с самими сильными штормами. Подобное инженерное решение ко всему прочему изолирует внутренние помещения от колебаний температуры снаружи и помогает при оптимизации охлаждения. Примечательно, что один из самых сокрушительных торнадо последних лет (категория F5) 20 мая этого года пронесся менее чем в 30 километрах от этого дата-центра, причем работоспособность последнего нарушена не была.

В 2011 году специалисты компании DataCave построили “торнадостойкий” ЦОД в Колумбусе, штат Индиана (США), крыша которого весит целых 2 млн. килограмм. Чересчур много? Совсем нет. Представители Data Cave отмечают, что подобная конструкция основана на анализе данных, полученных при изучении торнадо на Среднем Западе США, и на результатах моделирования ущерба, который они могут причинить строениям. По их мнению, в случае смерча крыша является ключевой линией обороны.

Наступил сезон ураганов: задраить люки

В рамках подготовки к предстоящему сезону ураганов компании со всего мира делают все возможное, чтобы в этом году минимизировать потери. К примеру, руководство компании Peak 10, которая управляет сетью дата-центров в юго-восточной части США, собрало группу быстрого реагирования, в которую вошли IT-специалисты и инженеры. Так Peak 10 надеется подготовиться к аварийному восстановлению в случае стихийного бедствия. Примечательно, что организация также предлагает своим клиентам сервис под названием «облачное восстановление», который пользуется спросом среди компаний, которые нуждаются в дополнительной безопасности и быстром восстановлении данных, утраченных во время стихийного бедствия.

«Компетентные специалисты являются наиболее важной частью любого плана аварийного восстановления», сказал Джефф Биггс, исполнительный вице-президент Peak 10 по операционной деятельности. «Наша команда предоставляет клиентам всю необходимую им поддержку. С помощью данного механизма мы можем быстро перебросить наших сотрудников туда, где это наиболее необходимо. При этом специалисты могут большую часть времени не покидать свои семьи и дома».

Руководство Peak 10 предприняло ряд шагов для минимизации риска даунтаймов на каждом из своих объектов вдоль восточного побережья США, включая пересмотр стандартных операционных процедур (СОП). Специалисты оценили механизмы обеспечения надлежащей безопасности и проверили комплектацию объектов расходными материалами, провели тестирование дублирующей сетевой инфраструктуры и подключений телекоммуникационных провайдеров. Кроме того, компания регулярно тестирует свои системы аварийного электропитания. Работа в этом направлении ведется в течение всего года. Она включает в себя нагрузочное тестирование источников бесперебойного питания (ИБП) и резервной системы аварийных дизельных электрогенераторов.

Повышение готовности ЦОД к стихийному бедствию

Представители SunGard Availability Services отмечают, что в прошлом году ураган “Сэнди” нанес ущерб на $ 75 миллиардов. Во время урагана SunGard AS получила 342 сигнала тревоги от клиентов и 117 сообщений о помощи в ликвидации последствий природной катастрофы. Для этих целей компания мобилизовала почти треть своих сотрудников, которые были рассредоточены в рамках 5 мобильных групп. Центр обработки данных компании SunGard Availability Services в городе Карлстадт, штат Нью-Джерси (США) служил импровизированным командным центром для местных органов власти. Кроме того, в нем разместились жертвы наводнения из близлежащих районов.

Недавно представители SunGard AS поделились с общественностью передовым опытом компании в области устранения последствий стихийных бедствий и подготовке к ним, а также информацией о проблемах, которые возникали во время “Сэнди” и 2000 других стихийных бедствий, имевших место в период с 1990 по 2013 гг. К ним относятся:

  • Проблемы в области защиты данных — «Резервное копирование на магнитные ленты — это хорошо. Но транспортировка этих лент в наши центры восстановления через затопленные улицы оказалась проблематичной», пишет представитель SunGard AS Юи Мерилин.
  • Проблемы при восстановлении системы – По словам Юи, отсутствие необходимых операционных систем, серверов, систем хранения данных, сетевых устройств и гипервизоров в центре восстановления было огромной проблемой для многих клиентов компании. Практически третьей части клиентов пришлось внести серьезные изменения в свои процедуры восстановления.
  • Проблемы с персоналом — «Концепция удаленной работы оказалась не очень подходящей для владельцев ЦОД во время «Сэнди», пишет Юи. «Это была региональная катастрофа. Мы наблюдали перебои в подаче электроэнергии на большом участке территории северо-восточного побережья США. Это означает, что работать из дома или кофейни Starbucks наши специалисты во многих случаях попросту не могли».
  • Устаревшие процедуры — «Инструкции по восстановлению зачастую являются устаревшими. Вряд ли кому-то сейчас пригодится мануал по восстановлению серверов под управлением Windows Server 2003», отмечает Юи.
  • Проблемы с софтом — «Управление изменениями (планирование и осуществление изменений в программном обеспечении или оборудовании работающей системы) для синхронизации производственной среды и среду восстановления до сих пор мало заботит многих наших клиентов. Но после очередного даунтайма они меняют свою точку зрения относительно данного вопроса», отметил эксперт.

Полный доклад Юи и его коллег можно найти здесь (английский). Компания также предлагает ознакомиться с Набором инструментов для подготовки к урагану (требуется регистрация).

Всего комментариев: 0

Оставить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *