Аварии ЦОД – новости от Lending Club, Cogeco Peer1 и TeliaSonera
Дата-центр может уйти в офлайн по целому ряду причин, включая перебои в электроснабжении, ненадлежащее техническое обслуживание оборудования, отсутствие необходимой избыточности, отказ резервного дизель-генератора или ИБП, а также неполадки в работе системы охлаждения из-за перегрузки в экстремальную летнюю жару. Зачастую причиной проблем выступает и пресловутый “человеческий фактор”. Но у операторов ЦОД есть возможность учиться на чужих ошибках и избегать досадных промахов. Чтобы как следует подготовиться к потенциально опасной ситуации и осознать возможные последствия бездействия, рекомендуем изучить громкие новости о недавних даунтаймах ЦОД.
Даунтайм ЦОД увел в офлайн сайт одной из крупнейших кредитных компаний США
Отключение дата-центра привело к уходу в офлайн сайта одной из крупнейших американских кредитных компаний Lending Club, которая с момента основания в 2006 году выдала разным заемщикам в общей сложности более $ 18 млрд. в виде кредитов. Инцидент очень обеспокоил
инвесторов компании.
В распоряжении Lending Club имеется онлайн-платформа для P2P-кредитования, которая позволяет заемщикам получить кредиты, а инвесторам предоставлять деньги под процент, изучая кредитные истории заемщиков. Компания одной из первых представила коммерческое приложение для Facebook. А в 2008 году Lending Club стал первым P2P-кредитором, получившим в Комиссии США по ценным бумагам и биржам США (SEC) разрешение на операции с векселями.
На минувшей неделе сайт компании ушел в офлайн и был недоступен несколько часов. Официальные представители Lending Club позже сообщили о том, что причиной проблемы стали неполадки в дата-центре. Но никаких подробностей о том, что именно пошло не так в ЦОД, озвучено пока не было.
Дата-центр Cogeco Peer1 в Атланте ушел в офлайн из-за проблем в системе резервного питания
Компания Cogeco Peer1, занимающаяся представлением услуг в области управляемого хостинга, оказалась в незавидной ситуации. После ухода в офлайн ее ЦОД в городе Атланта (США) у некоторых клиентов компании начались серьёзные проблемы, и они обрушились с критикой на своего сервис-провайдера, используя для этого соцсети. Многие клиенты заявили о том, что после случившегося переведут все свои рабочие нагрузки в AWS. Интересно также, что к обсуждению проблем Cogeco Peer1 в соцсетях присоединились и конкуренты компании, которые попытались переманить разгневанных клиентов.
Причиной даунтайма дата-центра, как сообщается, стало частичное прекращение подачи электроэнергии. Отключение электричества произошло примерно в половину второго дня. Устранить проблему и вывести ЦОД на полную мощность удалось только примерно в половину седьмого вечера. Сообщается, что сбой в системе электроснабжения привел к полному отключению инфраструктуры в определенных участках объекта. Основной причиной ухода ЦОД в офлайн был назван сбой в работе системы резервного питания серверной фермы.
В дата-центре TeliaSonera возникли проблемы из-за ошибки инженера
Из-за ошибки инженера TeliaSonera при конфигурировании маршрутизатора в ЦОД европейской телекоммуникационной компании пострадали многочисленные пользователи популярных интернет-сервисов, веб-сайтов и приложений вроде WhatsApp, Reddit, CloudFlare и AWS. Пресловутый “человеческий фактор” привел к тому, что большая часть трафика вместо Европы стала идти в Гонконг.
Проблемой оказались затронуты миллионы интернет-пользователей, которые начали испытывать сложности при подключении к интернету и работе с популярными приложениями. Инцидент оказался настолько значительным, что многие эксперты первоначально предположили возможность повреждения трансатлантического магистрального телекоммуникационного кабеля.
На устранение проблем в ЦОД TeliaSonera ушло около двух часов. После инцидента представители телекоммуникационной компании направили своим клиентам и партнерам сообщения с извинениями по поводу простоя. В блоге TeliaSonera также появилось сообщения о том, что компания активизирует усилия в направлении автоматизации своих систем, чтобы свести к минимуму вероятность даунтаймов по той же причине в будущем.
- Alexander: За R718 будущее )
- нет событий, чтобы показывать