Из-за чего ушли в офлайн дата-центры Shared Services Canada и Telstra
Лето – сезон перебоев в работе инфраструктуры серверных ферм и массовых отключений ЦОД. Ситуация усугубляется глобальным потеплением. Ведь прошедший год был признан самым жарким за всю историю наблюдений. И в обозримом будущем прохладнее не станет. Исследователи климата из НАСА и Национального управления океанических и атмосферных исследований США прогнозируют, что в 2016 году средняя температура поверхности планеты окажется еще более высокой. Если прогноз сбудется, то средняя температура на поверхности Земли впервые в истории метеонаблюдений будет удерживаться на рекордно высоком уровне в течение трех лет подряд.
Но в то время как простые обыватели радуются жаркому лету и связанным с ним развлечениям (купание в море, велосипедные прогулки, шашлыки на свежем воздухе), операторы дата-центров прекрасно понимают, что одновременно с ростом температуры наружного воздуха увеличиваются и цифры на счетах за электроэнергию. Это происходит потому, что повышение внешней температуры может легко поднять температуру внутри машзалов ЦОД, что, непременно, приведет к повышению нагрузки на кондиционеры и увеличению их энергопотребления.
Но это полбеды. Система охлаждения серверов вполне может не справиться с возросшей нагрузкой, результатом чего станет продолжительный даунтайм ЦОД. Статистика не радует: средняя стоимость простоя составляет $ 28900, а среднее время, необходимое для устранения последствий сбоя, составляет почти восемь часов. Кроме того, подобные инциденты могут иметь серьёзные репутационные потери: мало кто захочет работать с компанией, дата-центры которой периодически уходят в офлайн.
Чтобы избежать подобных проблем, операторы ЦОД могут изучать печальней опыт коллег и делать соответствующие выводы. Если такой подход кажется вам вполне рациональным, рекомендуем ознакомиться с представленной ниже информацией о недавних авариях в ЦОД и их причинах.
Повреждение кабеля вызвало аварию в австралийском ЦОД Telstra
Небольшой сбой в работе сетевой инфраструктуры вывел из строя ЦОД Telstra, что доставило много неудобств клиентам австралийской телекоммуникационной компании. Даунтайм привел к перебоям в работе сетей проводной и мобильной телефонной связи в большинстве крупных городов по всей Австралии. В частности, о проблемах сообщили клиенты телекоммуникационной компании из Сиднея, Мельбурна, Брисбена, Перта, Аделаиды и Хобарта.
Сообщается, что причиной проблем стало повреждение волоконно-оптического кабеля в ходе работ, проводимых сторонней компанией. Инженерам Telstra пришлось работать всю ночь, чтобы исправить ситуацию.
Интересно, что авария в дата-центре Telstra случилась всего через несколько дней после ухода в отставку Эреза Яркони, который занимал пост главного директора по информационным технологиям австралийской компании. Топ-менеджер покинул должность, которую он занимал чуть более года, после серии даунтаймов в дата-центрах компании. Из-за этих аварий пострадали многочисленные клиенты Telstra.
Отметим, что в течение последних шести месяцев из-за аварий в ЦОД Telstra произошло семь серьезных даунтаймов, приведших к отключениям телефонных сетей и сетей передачи данных в Австралии. Один из этих даунтаймов произошел в феврале и стал причиной того, что более половины клиентской базы Telstra из числа пользователей сотовой связи (а это 16 миллионов человек) оказались лишены доступа к сервисам компании.
В прошлом месяце компания Telstra запустила новую кампанию по продвижению своего бренда в попытке восстановить имидж поставщика надежных и высококачественных услуг связи. Ее руководство также объявило о намерении инвестировать $ 190 млн. в улучшение сетевой инфраструктуры в течение следующего года.
Задымление привело к даунтайму в канадском государственном дата-центре
Из-за задымления в дата-центре канадской государственной организации Shared Services Canada, которая отвечает за обслуживание правительственной IT-инфраструктуры, несколько ведомств оказались не в состоянии предоставлять услуги гражданам североамериканского государства в нормальном режиме.
Инцидент произошел в дата-центре, расположенном в Оттаве. Инженеры Shared Services Canada отмечают, что никакого огня не было, но из-за задымления им пришлось пойти на завершение работы серверных систем в аварийном режиме. Источник дыма также пока не был установлен. Инженеры уже начали расследование, чтобы определить причину появления проблемы и убедиться, что она не повторится.
Этот инцидент вызвал массовое отключение правительственных веб-сайтов и системы начисления заработной платы. Кроме того, в офлайн ушел сервер внутренней электронной почты для государственных служащих.
По данным информагентства The Canadian Press, около 50 тыс. работников предприятий из сферы общественных услуг оказались не в состоянии получать и отправлять сообщения по электронной почте в течение дня. Даунтаймом было затронуто помимо прочего Министерство транспорта Канады.
Всего комментариев: 0