Аварии в ЦОД – новости из США, Бразилии и Великобритании
Чтобы добиться сведения к минимуму вероятности даунтайма корпоративных и коммерческих серверных ферм и сокращения времени возможного простоя, проектировщики и строители таких ЦОД размещают внутри них сверхсовременные системы пожаротушения, специализированные датчики тепла, дыма, температуры и влажности, используют продвинутые системы климат-контроля и решения для организации электропитания с многократным резервированием ключевых узлов. Операторы ЦОД, в свою очередь, создают графики техобслуживания инфраструктуры и планы действий на случай возникновения чрезвычайных ситуаций.
Но даже этих усилий иногда оказывается недостаточно и, казалось бы, самые защищенные ЦОД благополучно уходят в офлайн. В качестве доказательства справедливости данного утверждения можно привести свежие новости об авариях в ЦОД из США, Бразилии и Великобритании.
Из-за аварии в ЦОД авиаперевозчик United Airlines был вынужден приостановить перелеты в США
Американская компания United Airlines, которая является третьим по величине авиаперевозчиком в мире, была вынуждена приостановить авиаперелёты по внутренним маршрутам на территории США из-за сбоя в работе вычислительного оборудования. Шесть рейсов были полностью отменены, еще более 200 – задержаны. Представители компании отметили, что работают над разрешением проблемы и принесли извинения за доставленные неудобства.
Напомним, что в октябре прошлого года авиаперевозчик United Airlines также столкнулся с подобной проблемой. Из-за перебоев в работе своей вычислительной инфраструктуры компания была вынуждена приостановить работу многих лайнеров. Задержано было в общей сложности около 60 рейсов. А в июле 2015 года компания приостановила перелеты своих лайнеров по всему миру из-за неисправного маршрутизатора.
Но на этот раз причиной стали проблемы в работе IT-оборудования, которое не принадлежит United Airlines. Сообщается, что сбоить начала Адресно-отчетная система авиационной связи (Aircraft Communications Addressing and Reporting System; ACARS). Из-за снижения пропускной способности сети ЦОД, используемой ACARS, пилоты авиалайнеров стали получать техническую информацию не в полном объеме. В частности пилоты United Airlines лишились доступа к информации о весе бортов.
Следует отметить, что цифровая система связи ACARS используется в гражданской авиации уже давно: с 1978 года. Эта система устарела морально и физически. На самом деле устаревшее IT-оборудование представляет собой серьезную проблему для авиакомпаний. Обновление подобной инфраструктуры – чрезвычайно трудный процесс, потому что системы должны продолжать работать круглосуточно.
IT-оборудование клиентов колокейшн-провайдера Equinix из британской столицы лишилось доступа к интернету
Часть клиентов колокейшн-провайдера Equinix, арендующих площадки внутри маршалов одного из лондонских коммерческих ЦОД компании, столкнулись с перебоями в работе сетевой инфраструктуры. Причиной стало временное прекращение подачи электричества на сетевое оборудование, случившееся в ходе рутинной работы по техническому обслуживанию, проводимой инженерами Equinix.
Из-за кратковременных перебоев в работе сетевой инфраструктуры IT-оборудование некоторых арендаторов площадок внутри дата-центра Equinix LD9 IBX в британской столице лишилось доступа к интернету. Отмечается, что пострадали клиенты, которые решили не вкладываться в «резервные соединения». Причем не совсем понятно, о каких именно соединениях речь: силовых или сетевых.
Одним из пострадавших оказался поставщик технологических решений для страховой отрасли SSP Worldwide. В очевидной попытке сохранить лицо перед клиентами руководство SSP Worldwide выступило после сбоя с заявлением, переложив всю вину в случившемся на колокейшн-провайдера. В письме компании клиентам говорится, что перебои в обслуживании являются прямым результатом действий, «осуществляемых инженерами дата-центра».
Клиенты собираются засудить Equinix за даунтайм ЦОД в Бразилии
Но на этом злоключения колокейшн-провайдера Equinix не заканчиваются. Компания может стать ответчиком в суде из-за того, что множество серверов ее клиента потеряли доступ к сети. Инцидент, из-за которого напрямую или косвенно пострадали в общей сложности 16 тыс. коммерческих и некоммерческих организаций (включая ратуши, больницы, школы, сайты электронной коммерции и заводы), произошел в Бразилии. Судебное разбирательство по данному делу может начаться уже в ближайшее время.
Представители Equinix заявляют, что вины колокейшн-провайдера в случившемся нет. Компания просто отключила электроснабжение и доступ к сети для оборудования одного из своих клиентов, который не оплачивал услуги Equinix в течение шести месяцев (в период с июля по декабрь 2016 года). Этим клиентом является местный поставщик облачных сервисов ServerLoft.
Машины ServerLoft, которые ушли в офлайн, были размещены в бразильском дата-центре Equinix SP2. Они были недоступны в период с 19 по 27 декабря 2016 года. После этого инженеры Equinix снова подключили серверы к силовой и сетевой инфраструктуре, чтобы клиенты ServerLoft могли извлечь свои данные и осуществить миграцию приложений на другие облачные платформы.
Комментируя ситуацию, юристы фирмы Assis e Mendes Law Firm, представляющей интересы пострадавших организаций, заявили, что вызванный простоем инфраструктуры ServerLoft ущерб был огромен. Фирма уже собирала достаточно доказательств, чтобы открыть дело против ServerLoft. Ее специалисты также рассматривают возможность подачи иска в суд против Equinix, потому что колокейшн-провайдер вполне мог бы повторно подключить машины к силовым и сетевым каналам раньше, для того чтобы клиенты ServerLoft могли как можно скорее извлечь свои данные.
Всего комментариев: 0