Изменение инфраструктуры ЦОД обернулось уходом Facebook в офлайн
В начале этого месяца многомиллионная армия пользователей Facebook начала испытывать сложности с получением доступа к своим аккаунтам в социальной сети. Позже представители американской компании выступили с официальным заявлением по этому поводу, приписывая уход соцсети в офлайн ошибке, возникшей во время изменения конфигурации инфраструктуры внутри одного из ЦОД Facebook.
“Ранее произошла ошибка при изменении конфигурации инфраструктуры, что привело к краткосрочным перебоям при получении доступа к Facebook. Мы сразу же обнаружили проблему и устранили ее, и теперь у всех вновь появилась возможность подключиться”, отметил представитель компании в заявлении по электронной почте.
Офлайн соцсети длилось немногим дольше 10 минут, но этого оказалось вполне достаточно, чтобы гневные пользователи завалили Twitter огромным множеством саркастических постов с хэштегом #Facebookdown. Еще несколько относительно “свежих” отключений веб-сайта американской компании имели место в августе и в июне текущего года. Тем не менее, следует признать, что в распоряжении Facebook имеется относительно надежная инфраструктура ЦОД, которая проектируется практически полностью “с нуля” с привлечением собственных талантливых инженеров компании. Дата-центры американской компании находятся на обоих побережьях США, а также в Швеции. Кроме того, серверы, СХД и сетевые системы Facebook размещены в определенных коммерческих ЦОД оптовых колокейшн-провайдеров из США.
Крупные интернет-компании, в распоряжении которых имеются гипермасштабные центры обработки данных, вроде Facebook, Google и eBay, вынуждены полагаться на специальное программное обеспечение, которое делает их IT-системы более устойчивыми ко всевозможным сбоям. Этот подход отличается от традиционного подхода к формированию многоуровневых систем резервирования механической и электрической инфраструктуры, применяемого при создании многих корпоративных дата-центров. В типичном гипермасштабном ЦОД кластер серверов формируется таким образом, что может поддерживать рабочие нагрузки даже тогда, когда отдельные вычислительные узлы, входящие в его состав, отказывают. Тем не менее, даже этот подход, очевидно, не обеспечивает 100-процентную защиту от риска ухода веб сервисов крупных интернет-компаний в офлайн.
- Alexander: За R718 будущее )
- нет событий, чтобы показывать