Добавить в избранное
Новости ЦОД и Дата-Центров
Все, что Вам нужно знать о ЦОД

Аварии в дата-центрах Microsoft привели к перебоям в работе платформы Azure в Японии и облачного офисного пакета Office 365 в Европе и США

14.04.2017
|
Authors
|
Раздел: Аварии, Инфраструктура ЦОД, Новости
|

Аварии в дата-центрах MicrosoftНедавние громкие аварии в дата-центрах Delta Airlines и Amazon Web Services оказались в центре внимания не только профильных СМИ. О них писали даже далекие от индустрии ЦОД издания. Оно и понятно, учитывая огромные негативные последствия этих даунтаймов в виде многочисленных задержек авиарейсов Delta Airlines и отключения множества популярных сайтов, размещенных в облаке Amazon.

Но тот факт, что даунтаймам в других дата-центрах СМИ уделяют меньше внимания, отнюдь не делает их менее серьезными происшествиями, которые наносят огромный урон репутации владельцев ЦОД и вредят бизнесу их клиентов. На минувшей неделе в этом плане «отличилась» американская корпорация Microsoft. Аварии в дата-центрах софтверного гиганта привели к перебоям в работе платформы Azure в Японии и облачного офисного пакета Office 365 в США и Европе.

Проблемы с системой охлаждения дата-центра Microsoft привели к перебоям в работе облака Azure в Японии

Многочисленные корпоративные клиенты Microsoft из Азиатско-Тихоокеанского региона лишились доступа к облачным сервисам Azure на несколько часов из-за аварии в центре обработки данных софтверного гиганта, который располагается в Японии. Как впоследствии сообщили представители Microsoft, авария случилась из-за сбоя в работе системы охлаждения серверов.

Согласно информации, опубликованной на веб-сайте Azure, у клиентов из вышеназванного региона возникли проблема с подключением к ресурсам облака. Инженеры определили, что причиной потери некоторой части ресурсов облачной платформы стал отказ системы охлаждения.

Проблемы начались около 7 часов утра по тихоокеанскому времени и продолжились до второй половины дня. Были затронуты как хранилища, так и виртуальные машины, а также множество других облачных сервисов, таких как Web Apps, Backup, HDInsight, Key Vault и Site Recovery.

Команда облачной платформы Microsoft Azure для повышения качества обслуживания своих азиатских клиентов в 2014 году запустила дата-центры в японских префектурах Сайтама и Осака. О том, в каком именно из этих ЦОД произошел даунтайм, не сообщается. При этом эксперты отмечают, что аварии, связанные с охлаждением центров обработки данных, являются достаточно частым явлением.

Аналитики говорят и о том, что корпоративным клиентам в последнее время все сложнее выбирать оптимальных поставщиков облачных сервисов, ориентируясь на надежность, поскольку даже лидеры рынка все чаще разочаровывают своих партнеров. Так, самый серьезный до сих пор облачный даунтайм в этом году имел место в конце февраля. Сбой в работе облака Amazon был вызван «человеческим фактором»: ошибкой инженера при настройке оборудования.

Крупная авария в ЦОД Microsoft привела к недоступности Office 365 в США и Европе

Обычные пользователи облачных сервисов Microsoft потребительского класса вроде Office 365, Xbox Live и OneDrive на минувшей неделе также рапортовали о проблемах. Крупный даунтайм затронул пользователей таких сервисов со всей территории Соединенных Штатов и Западной Европы. Последние испытывали сложности при входе в свои учетные записи и не могут получить доступ к контенту в хранилище OneDrive. Поскольку проблема носила прерывистый характер, пользователи могли обновить страницу или предпринять еще одну попытку входа в аккаунт, и часто этом им удавалось.

Уже на следующий день после инцидента более 1.5 тыс. разочарованных пользователей оставили свои гневные комментарии на страницах тематического ресурса downdetector.com.

Представители Microsoft отметили, что у них пока нет точной информации о причинах проблем в работе онлайн-сервисов. Предполагается, что ранее из-за устранения одной из неполадок изменилась конфигурация сервисов, взаимодействующих с OneDrive, что привело к сбоям. Специалисты Microsoft проводят анализ затронутых систем, чтобы определить, какие дальнейшие шаги необходимы для полного восстановления.

При этом сторонние аналитики не исключают, что всему причиной снова стал «человеческий фактор», то есть одна или несколько ошибок инженеров при выполнении своих обязанностей в ЦОД.



Тэги: , , ,
|
Источник:
|
RSS 2.1
|
|
ОСТАВИТЬ ОТЗЫВ



Партнеры