Uptime Institute OSR – новая система ранжирования серьезности даунтаймов ЦОД
Организация Uptime Institute представила новую систему ранжирования серьезности даунтаймов ЦОД. Инструмент, получивший название Outage Severity Rating (OSR), призван помочь заинтересованным сторонам понять и сформулировать причины перебоев в работе корпоративных и коммерческих дата-центров в контексте того, как каждый подобный инцидент влияет на бизнес.
С помощью OSR организации смогут рассматривать аварии в корпоративных и коммерческих дата-центрах, которые они используют, с точки зрения фактического негативного влияния на бизнес, а не с точки зрения количества подрежённых компонентов физической инфраструктуры ЦОД и серьезности их повреждения .
В течение последних трех лет специалисты Uptime Institute изучали опубликованную в открытом доступе информацию о сбоях в работе серверных ферм и авариях в ЦОД, чтобы лучше понять причины и последствия незапланированных простоев дата-центров.
В разрезе этого трехлетнего периода число аварий в ЦОД, информация о которых становилась достоянием общественности, неуклонно росло: в 2016 году произошло 27 инцидентов; в 2017 году — 57 инцидентов; в 2018 году — 78 инцидентов.
Как отмечают эксперты, этот показатель увеличивался вместе с усложнением инфраструктуры ЦОД. При этом проблемы с IT-системами, сетями и вспомогательным оборудованием внутри дата-центров наносят все более серьезный урон бизнесу и репутации фирм, использующих эти серверные фермы.
Специалисты организации Uptime Institute отмечают, что в большинстве случаев трудно понять истинную природу аварий в ЦОД и величину урона, поскольку большинство инженеров по-прежнему характеризуют серьезность даунтаймов в зависимости от количества пострадавшего IT-оборудования и других элементов физической инфраструктуры ЦОД.
В Uptime Institute подчеркивают, что система OSR была разработана, чтобы позволить специалистам по инфраструктуре центров обработки данных и другим экспертам анализировать аварии и их последствиях на всех уровнях, а затем обмениваться информацией друг с другом, передавая данные унифицированном и нормализованном виде.
Система OSR устраняет необходимость в использовании размера урона физическому оборудованию в качестве отправной точки при анализе сбоев в ЦОД и вместо этого сосредотачивается на способности гибридной цифровой инфраструктуры поддерживать критически важные бизнес-процессы.
Рейтинг серьезности аварий в дата-центрах OSR имеет следующую структуру:
Незначительный уровень (Negligible) – Незначительный сбой в работе ЦОД, который был зарегистрирован, и о котором был составлен отчет, но при этом влияние данного инцидента на бизнес-услуги является незначительным или отсутствует.
Минимальный уровень (Minimal) — Минимальное отключение, когда работа некоторого количества IT-процессов и бизнес-сервисов нарушается или ухудшается, но при этом инцидент характеризуется минимальным влиянием на репутацию компании, ее клиентов / пользователей ее сервисов.
Существенный уровень (Significant) — Значительный сбой с наблюдаемыми перебоями в обслуживании клиентов / пользователей. При этом такой сбой характеризуется ограниченным объемом негативных эффектов или малой продолжительностью. Наблюдается минимальный или нулевой негативный финансовый эффект. Возможно негативное влияние на репутацию или критика в адрес компании из-за ее неспособности обеспечить соблюдение нормативных требований.
Серьезный уровень (Serious) – Серьезная авария с нарушением обслуживания клиентов и / или технологических процессов. Перечень негативных последствий подобного инцидента включает в себя некоторые финансовые потери, нарушения нормативных требований, ущерб репутации и возможные проблемы в области безопасности.
Значительный уровень (Severe) — Критический сбой с серьезными нарушениями в работе сервисов и / или бизнес-процессов, в число последствий которого входят большие финансовые потери, возможные проблемы в области безопасности, нарушения соответствия нормативным требованиям, потери клиентов и репутационный ущерб.
Всего комментариев: 0