Аварии в ЦОД: новости из Польши, Канады и Нигерии
Согласно свежему отчету, подготовленному специалистами консалтинговых компаний S&P Global Market Intelligence и ThousandEyes (принадлежит Cisco Systems Inc.), в первую неделю мая 2021 года число серьезных перебоев в работе интернет-инфраструктуры по всей планете достигло отметки в 250 единиц, что на 16% меньше по сравнению с предыдущей неделей.
Количество глобальных сбоев приложений для совместной работы в течение рассматриваемого периода снизилось вдвое (до трех). На долю отключений в рабочее время пришлось 39% от общего числа сбоев в глобальной сети, что на 6 процентных пунктов меньше, чем на предыдущей неделе.
Тем не менее, число инцидентов все еще находится на достаточно высоком уровне. Причем многие из них вызваны авариями в серверных фермах. География подобных происшествий впечатляет: аварии в дата-центрах случаются по всему миру. Справедливость данного утверждения подтверждает свежий дайджест портала TelecomBloger, охватывающий инциденты в Польше, Канаде и Нигерии.
Пожар в ЦОД центральной избирательной комиссии в Нигерии
Пожар внутри дата-центра в городе Кано (Нигерия), случившийся в минувшем месяце, уничтожил IT-оборудование, принадлежащее Независимой национальной избирательной комиссии (Independent National Electoral Commission; INEC) африканской страны. По словам чиновников, все данные внутри ЦОД ранее были благополучно скопированы на резервные носители.
Пожар произошел в центре обработки данных рядом с офисами INEC рано утром во вторник 20 апреля. В результате было существенно повреждено здание, в котором размещались серверы, ноутбуки и другое оборудование.
Представители организации предположили, что возгорание могло начаться в системе кондиционирования воздуха. В частности, предполагается, что пожар возник из-за неисправного кондиционера. Свидетели полагают, что пожар произошел из-за скачков напряжения в сети, в результате которых «взорвались некоторые кондиционеры». К сожалению, команде ЦОД не удалось вовремя вызвать пожарную службу, но сотрудники INEC хотя бы смогли остановить распространение огня в здании.
В результате пожара были уничтожены портативные компьютеры, настольные компьютеры и серверы, а также промышленные принтеры, используемые для печати бумажных копий реестра избирателей. Кроме того, огонь уничтожил блейд-серверы производства Dell, на которых хранились электронные копии реестра избирателей.
Бобры вызвали отключение интернета в канадской провинции Британская Колумбия
В субботу 24 апреля 2021 года крупные грызуны перегрызли волоконно-оптический кабель в одном из слабонаселённых районов Канады, принадлежащий телекоммуникационной компании Telus. Выяснилось, что виновниками стали бобры. На это указывает тот факт, что инцидент случился возле ручья. Кроме того, впоследствии обнаружилось, что грызуны использовали некоторые элементы кабеля в качестве материалов для строительства своей плотины.
Из-за бобров с отключением интернета столкнулись 9 сотен клиентов компании Telus в канадской провинции Британская Колумбия. Благо, телекоммуникационную магистраль удалось оперативно отремонтировать, и обслуживание клиентов возобновилось уже на следующий день после аварии.
Магистральный кабель был защищен кабелепроводом толщиной 4,5 дюйма (11,4 сантиметра) и проложен на глубине примерно в три фута (0,9 метра) под землей. Судя по всему, бобры рыли тоннель под землей рядом с ручьем, наткнувшись на злополучный кабель. Животные сначала прогрызли кабелепровод, а затем перекусили кабель в нескольких местах.
Инженерам пришлось усилить кабель, закопанный под мерзлым грунтом. Представители Telus назвали инцидент «очень странным и уникальным для Канады поворотом событий». Повторение подобного происшествия они считают маловероятным.
Сотни отключений интернета и аварий в ЦОД, связанных с отключением электроэнергии / перебоями в работе телекоммуникационной инфраструктуры, обусловлены активностью белок, змей и других существ, которые случайно вызывают короткое замыкание / перегрызают кабели, выводя из строя / обесточивая оборудование.
Специалисты Google однажды обнаружили частые и короткие перебои в работе мультитерабитного оптоволоконного канала, проходящего через американский штат Орегон. Выяснилось, что причиной являлись коровы, наступавшие на оптоволоконный кабель. Интернет-компании также пришлось укрепить тысячи километров подводных кабелей после того, как обнаружилось, что акулы любят нападать на них.
Польские постаматы заблокированы из-за выхода из строя дата-центра T-Mobile
Несколько кластеров автоматизированных почтовых станций (постаматов), принадлежащих польской InPost, были заблокированы из-за сбоя в работе инфраструктуры поставщика услуг ЦОД, используемого данной компанией. Инцидент произошел 11 мая 2021 года.
Неизвестная проблема в центре обработки данных T-Mobile в Кракове (Польша) привела к перебоям в работе официального веб-сайта и фирменного приложения InPost, помешавшим клиентам компании помещать и забирать посылки из постаматов.
Представители InPost отметили, что проблема в ЦОД была успешно устранена в тот же день, но клиенты компании продолжили рапортовать об инцидентах 12 мая. В частности, пользователи сообщали в социальных сетях о поступлении в фирменное приложение / на мобильные телефоны / электронную почту сообщений о посылках, которые уже были получены или отправлены. Компания раскритиковала T-Mobile за отсутствие прозрачности в контексте объяснения причин аварии в ЦОД.
Перебои в работе центров обработки данных способны серьезно повлиять на системы запирания с цифровым подключением. В результате даунтайма облака Google Cloud в 2019 году были заблокированы системы интеллектуальных замков дочерней компании Nest, и некоторые из владельцев подобных систем не смогли войти в свои дома. Сбои в работе дата-центров Google вызвали повторение проблемы как минимум пять раз.
Случившаяся в 2020 году проблема с сетевой инфраструктурой автопроизводителя Tesla привела к тому, что некоторые водители не смогли сесть в свои автомобили или проверить, насколько заряжен аккумулятор.
Всего комментариев: 0