Аварии в ЦОД и их последствия: новости от eBay, Boeing и не только
Треть лиц, ответственных за поддержание работоспособности корпоративных и коммерческих дата-центров по всему миру, которые приняли участие в ежегодном исследовании организации Uptime Institute, признались, что в прошлом году их ЦОД был нанесен урон в той или иной форме из-за даунтаймов. Целых 10% респондентов сообщили о том, что недавние значительные даунтаймы стоили их бизнесу более 1 миллиона долларов.
Прогнозируется, что рынок центров обработки данных будет расти более чем на 11% только в Европе в течение следующих 3 лет, при этом сильный рост ожидается также во многих других крупных регионах, включая Америку и Юго-Восточную Азию. Отрасли здравоохранения, банковских услуг, страхования и электронной коммерции в значительной степени зависят от надежности ЦОД, в которых хранятся и обрабатываются данные соответствующих организаций.
Субъекты этих отраслей прекрасно понимают, что даже кратковременное отключение электропитания, ведущее к даунтайму их ЦОД, может привести к потере очень ценных и / или незаменимых данных. И это лишь подтверждают свежие новости об авариях в дата-центрах по всему миру.
Продавцы eBay пострадали от аварии в ЦОД Photobucket
Сервис Photobucket, позволяющий хранить мультимедийные файлы, пользуется популярностью у десятков миллионов пользователей. Они хранят свои фото на серверах компании и встраивают ссылки на них в страницы своих сайтов. В число таких пользователей входят помимо прочего и предприятия электронной коммерции, продающие товары и услуги через площадку eBay, которая тесно интегрирована с Photobucket.
Эта тесная интеграция «вышла боком» многим пользователям eBay, когда в дата-центре Photobucket произошел сбой. Причем авария в ЦОД случилась в самый разгар сезона рождественских распродаж — за неделю до католического Рождества. И ее последствия команде сервиса пришлось устранять довольно долго: работы велись в течение 2 недель.
Первоначально в Photobucket объявили, что авария в основном центре обработки данных компании случалась из-за полного отключения подачи электроэнергии 18 декабря. После прекращения подачи электричества из центральной сети случился внезапный сбой в работе системы резервного электроснабжения. Это, в свою очередь, обернулось неожиданным завершением работы вычислительных узлов. После восстановления электропитания из центральной сети команде ЦОД не удалось сразу же перезапустить все серверы.
Решение не проводить тест ЦОД перед миграцией IT-оборудования обернулось крупным сбоем в работе банка TSB
Крупный сбой в работе одного из дата-центров финансовой организации TSB, в результате которого два миллиона клиентов этого британского банка в 2018 году лишились доступа к текущим счетам, был вызван решение отказаться от тестирования нового центра обработки данных перед масштабной миграцией IT-оборудования. К таким выводам пришли специалисты юридической фирмы Slaughter and May, которым было поручено провести расследование по факту случившегося инцидента.
В 300-страничном отчете отмечается, что поставщик IT-услуг Sabis, нанятый TSB для проведения миграции, провел тестирование всех дата-центров кроме одного. В документе также указано, что тот факт, что один из центров обработки данных не был протестирован, был скрыт от членов совета директоров TSB перед запуском IT-инфраструктуры банка после миграции в апреле 2018 года.
Банкирам из TSB пришлось потратить около 370 миллионов фунтов стерлингов (480 миллионов долларов США) на устранение последствий сбоя в работе ЦОД, включая сборы за расследование в размере 25 миллионов фунтов стерлингов (32 миллиона долларов). Затраты могут дополнительно увеличиться, если регулирующие органы оштрафуют банк.
NERSC останавливает суперкомпьютер в Калифорнии на фоне отключения электроснабжения
Международный центр по окружающей среде и дистанционному зондированию имени Нансена (Nansen Environmental and Remote Sensing Centre Belk; NERSC), который является частью Национальной лаборатории им. Лоуренса Беркли в США, был вынужден остановить свой суперкомпьютер в Калифорнии в начале октября 2019 года ввиду отключения электроснабжения.
Массовое отключение электроснабжение в регионе случилось по решению руководства энергетической компании PG & E. Решение отключить подачу электричества в Калифорнии, которое затронуло многочисленные предприятия и сотни тысяч калифорнийцев, было принято, чтобы снизить риск возникновения пожаров.
Примечательно, что незадолго до отключения суперкомпьютера NERSC на нем была запущена симуляция лесных пожаров в регионе, чтобы понять, как пожары влияют на водораздел Калифорнии. Из-за внепланового завершения работы машины эта симуляция была приостановлена – равно как и другие исследовательские проекты, направленные на изучение последствий антропогенного изменения климата.
Вирус- вымогатель поразил ЦОД CyrusOne и оборудование клиентов колокейшн-провайдера
Вредоносная программа-вымогатель в начале декабря 2019 года поразила коммерческий дата-центр колокейшн-провайдера CyrusOne и оборудование клиентов данной компании, включая нескольких поставщиков финансовых услуг.
Атака затронула только клиентов, пользующихся услугами центра обработки данных колокейшн-провайдера в Нью-Йорке. Злоумышленники получили доступ к сетевым ресурсам и зашифрованным файлам, принадлежащим клиентам компании, отправив требование выкупа как CyrusOne, так и ее клиентам. Колокейшн-провайдер отказался платить злоумышленникам. У CyrusOne имеется 45 центров обработки данных в США, Азии и Европе.
BB&T подает в суд на Hitachi Vantara из-за аварии в ЦОД в 2018 году
В начале декабря прошлого года американская финансовая холдинговая компания BB&T подала в суд на поставщика высокотехнологичного оборудования для серверных ферм Hitachi Vantara за аварию в ЦОД, которая произошла в 2018 году.
И иске на производителя компьютерного оборудования Hitachi Vantara утверждается, что компания была ответственна за «катастрофическое» отключение, которое не позволило миллионам клиентов пользоваться банковскими онлайн-услугами, мобильным банкингом, банкоматами и банковскими переводами в течение нескольких дней в феврале 2018 года.
Boeing судится с Ark Data Centres из-за аварии в ЦОД
В начале января 2020 года производитель военной техники Boeing Defense UK подал в суд на поставщика услуг центров обработки данных Ark Data Centres. Предметом иска является авария в коммерческом дата-центре Ark Spring Park, произошедшая почти два года назад. Причина инцидента была выявлена и устранена. Дальнейшие подробности судебного процесса пока не известны. В Boeing от комментариев отказались.
ЦОД, оказавшийся в центре судебного процесса, расположен на территории кампуса площадью 15 гектаров в Коршаме, графство Уилтшир. Построенный в соответствии с требованиями к уровню надежности Tier III дата-центр ранее принадлежал британскому Министерству обороны.
На территории кампуса расположены пять зданий ЦОД, три из которых были введены в эксплуатацию летом 2019 года. Каждое из них включает по несколько машзалов, внутри которых имеется в общей сложности менее 20 тыс. квадратных метров полезного пространства.
Всего комментариев: 0