Следуйте этим рекомендациям при создании системы мониторинга инфраструктуры ЦОД
На этот раз мы пропустим вступление, наполненное статистикой и информацией о тенденциях, сосредоточившись целиком и полностью на практичных и конкретных советах в части создании системы мониторинга инфраструктуры дата-центра.
Все дата-центры разные. Некоторые обслуживают рабочие нагрузки, связанные с осуществлением высокопроизводительных вычислений. В таких серверных фермах используются системы прямоконтактного жидкостного охлаждения или иммерсионного охлаждения, тогда как вычислительные узлы размещаются в стойках с рекордно высокой плотностью. В других ЦОД, которые используются для обработки менее ресурсоемких задач (например, для обслуживания рабочих нагрузок, связанных с хранением данных в облаке) картина обратная – там применяются обычные воздушные системы охлаждения и более традиционное вспомогательное оборудование.
Тем не менее, все без исключения ЦОД являются критически важными объектами. Поэтому для эффективной и безопасной эксплуатации современного дата-центра требуются оптимальные механизмы мониторинга. Система мониторинга окружающей среды в ЦОД должна быть способна контролировать динамику следующих основных параметров:
• Температура. Этот параметр следует отслеживать независимо от типа ЦОД. Ни при каких обстоятельствах ни стандартный стоечный сервер, ни узел системы для высокопроизводительных вычислений не будут в течение длительного времени работать при слишком высокой температуре. Следует отметить, что границы оптимальных рабочих температур машин постоянно меняются в сторону роста. Вендоры предлагают все более стойкие к повышенным температурам машины. Это следует учитывать при создании системы мониторинга температуры серверов, чтобы избежать серьезных проблем.
• Влажность. Так же как и в случае отслеживания температурных показателей мониторинг влажности в пределах дата-центра имеет критически важное значение, позволяя избежать повреждения ценных систем. Есть несколько способов для определения влажности воздуха в ЦОД – например, внутри стойки и снаружи стойки. Уровень влажности должен быть устойчивым при любых обстоятельствах и ситуациях.
• Контроль среды внутри горячих и холодных коридоров. Во многих ЦОД используются системы изоляции воздуховодов в форме горячих и холодных коридоров. Чтобы получить максимальную отдачу от инвестиций в приобретение и развертывание подобных систем, необходимо контролировать такие параметры внутри них как температура, влажность, давление и направление движения воздуха.
• Статическое электричество. Датчики мониторинга статического электричества помогут зафиксировать попадание в ЦОД объектов с высоким статическим зарядом. Статическое электричество может представлять очень большую опасность для многих элементов инфраструктуры дата-центра. Поэтому размещение таких датчиков в ЦОД имеет важное значение.
• Физический доступ к элементам инфраструктуры дата-центра. С целью повышения безопасности многие организации внедряют датчики, позволяющие фиксировать случаи получения физического доступа к элементам инфраструктуры дата-центра – например, к серверным стойкам. Эти датчики могут предупреждать соответствующих специалистов о случаях получения теми или иными лицами несанкционированного доступа к оборудованию. Более продвинутые сенсоры могут активировать систему видео-мониторинга (камеры безопасности), объективы которых нацелены точно на ту самую стойку, в которой сработал датчик.
Мониторинг протечек. Рекомендуется установить датчики протечек вокруг внешних стен машзала с серверами, а также под фальшполом. Также необходимо поместить датчики рядом с элементами системы охлаждения ЦОД, использующей в своей работе токопроводящие жидкости.
При работе с датчиками и сенсорными технологиями нужно уделять повышенное внимание долговечности. Имейте в виду, что ни один датчик не будет гарантированно работать вечно. Отказы датчиков – не редкость. Вот почему так важна избыточность. Добиться необходимого уровня избыточности без излишнего расходования ресурсов можно путем развертывания интеллектуальных программно-аппаратных инструментов мониторинга инфраструктуры дата-центра, позволяющих создавать автоматизированные процедуры восстановления. Эти системы могут быть сконфигурированы таким образом, чтобы активировать запасные датчики в случае выхода из строя основных.
С учетом большого количества точек размещения датчиков в пределах большого дата-центра, операторы должны иметь надлежащий механизм предупреждения о выходе сенсорного оборудования из строя. Если датчик выходит из строя, соответствующее лицо должно быть немедленно уведомлено с целью скорейшего проведения замены устройства. Аналогичные действия должны осуществляться ответственными специалистами, если сенсорное устройство начинает выдавать некорректную информацию или становится причиной ложной тревоги. Профилактическое тестирование и надлежащая техподдержка датчиков внутри ЦОД помогут уменьшить вероятность того, что подобное произойдет в самый неподходящий момент.
Всего комментариев: 0