План аварийного восстановления инфраструктуры Дата-Центра.
Никакой Дата-Центр не застрахован от аварии. Аварии в Дата-Центрах происходят постоянно, причины их возникновения различны: от человеческого фактора, выхода из строя оборудования до стихийного бедствия. Хуже всего то, что вы никогда не знаете, когда это произойдет с вами.
Главный вопрос:
Действительно ли Вы готовы к аварии, если она произойдет в вашем Дата-Центре, сейчас?
Уважаемые представители Дата-Центов, не могли бы Вы поделится информацией о том, как Вы готовитесь к нештатным ситуация в ЦОД и есть ли у Вас план аварийного восстановления инфраструктуры?
Да-да-да. Очень хотелось бы обсудить предмет, поскольку даже среди «корпоративщиков» начинают возникать подобные темы.
Ну,много писать.
У нас ,»корпоративщиков» )):
— 100% резервирование,по возможности 🙂
— резервный ДЦ (есть)
— инструкции для смен HD,надеюсь ,не формальные
— оперативные схемы нормальной работы систем кондиционирования,эл.снабжения,ИБП
— инструкции по оперативным переключениям для специалистов (со всеми ,надеюсь,возможными вариантами точек отказа)
— переодические тренеровки.Ну,в основном только тыкая пальцем)), но при ежегодных профилактиках тех же упсов удается и ручками поделать..
Как клиент нескольких ДЦ, могу сказать, что при поиске площадки, большая часть пердставителей ДЦ затруднилась показать такие документы, а в устой беседе не каждый тех. специалист смогу проговорить схему и по минутно расписать действия тех. служб, которые будут предприняты при наступлении описанных мной случаев. Как поставщик услуг гарантирующий определенный SLA своим клиента, я не смог получить одекватного SLA со сторный не одного ДЦ, учитывая тот фоакт, что стоимость услуг далеко не копеечная. Данная проблема стоит крайне остро для тех, кому очень важна непрерывность в ИТ безнес процессах.
Интересно же как другие делают.
Как классифицируют инциденты по уровню угрозы? Как эти уровни назначаются? Как планируют время восстановления? На что направлены DRP — на оборудование или сервисы?
ЗЫ. Я признаться не разу не писал подобные доки (мало где на предприятиях есть службы эксплуатации ЦОДа), поэтому интересуюсь.