Интеллектуальный помощник для охлаждения дата-центра

23 марта 2018

Интеллектуальный помощникСтартап AdeptDC применяет машинное обучение для устранения крупнейшей причины неэффективности центров обработки данных: чрезмерной избыточности (резервирования ресурсов).

Действительно ли ваш дата-центр нуждается во всей установленной в нем инфраструктуре охлаждения? Если он похож на большинство остальных ЦОД, ответ будет отрицательным. Не секрет, что инфраструктура как охлаждения, так и электропитания в большинстве дата-центров чрезмерно резервируется, обеспечивая излишнюю избыточность.

Наиболее ярко ситуацию иллюстрируют цифры, опубликованные организацией Upsite Technologies, демонстрирующих помимо прочего и то, что холодопроизводительность обычно в четыре раза выше, чем необходимо:

«В случае большинства центров обработки данных в среднем 75% холодопроизводительности является излишней. Это означает, что если вы потратите 100 долларов США на охлаждение, то 75 долларов США будут потрачены впустую. По оценкам Gartner, 40% ресурсов системы охлаждения расходуется впустую. По словам инженеров Google, с помощью искусственного интеллекта (ИИ) им удалось добиться экономии около 35% расходов на охлаждение. Предварительные тесты Upsite Technologies показывают, что в зависимости от погодных условий, внешней температуры и влажности наружного воздуха, а также в зависимости от типа охлаждения вы можете сэкономить 25-40%.»

Большинство компаний-владельцев дата-центров не располагают бюджетом и опытными сотрудниками, которые есть у Google, позволяя поисковому гиганту создавать новые эффективные центры обработки данных «с нуля». Поэтому стартап под названием AdeptDC предлагает им готовую к использованию интеллектуальную систему охлаждения ЦОД, которая полностью основана на программном обеспечении и использует диагностическую информацию (такую как результаты измерений температуры процессора), чтобы избежать ненужного расходования времени и денег на сложные процедуры подключения дополнительных датчиков к системам центров обработки данных.

И, как утверждают специалисты компании, эта система взаимодействует с любым оборудованием и любым типом охлаждения. Нужно лишь собрать эту исходную информацию, охватывающую цикл работы с полной нагрузкой (желательно в течение месяца), и система управления температурным режимом на основе машинного обучения предложит возможности для корректировки пороговых значений активации инфраструктуры охлаждения в режиме реального времени – как интеллектуальный термостат для центра обработки данных.

Интеллектуальный помощник

Стартап AdeptDC, который базируется в Санта-Кларе, штат Калифорния (США), заявляет об спешных экспериментальных развертываниях своей системы в партнерстве с UPS, Технологическим институтом Джорджии и Arrow Electronics.

«Самая большая проблема заключается в том, что между охлаждением и удалением тепла не существует взаимнооднозначного соответствия. Вы меняете пороговое значение срабатывания теплохладотехники, но это не гарантирует соответствующего изменения. Все из-за сложности потоков воздуха и термических проблем, таких как нагрев с запаздыванием. К тому же IT-нагрузки изменяются быстрее, чем может среагировать система охлаждения, что затрудняет прогнозирование изменений окружающей среды. Процессы, связанные с IT-инфраструктурой, меняются очень быстро, но воздух остывает медленно», — сказал генеральный директор AdeptDC Раджат Гош.

По его словам, невозможно получить одинаковые показания даже от тепловых систем в двух идентичных центрах обработки данных. Как отметил Гош, воздушный поток, как правило, является турбулентным и недетерминированным. Сегодня вы получаете определённый воздушный поток при определенном пороговом значении активации инфраструктуры охлаждения ЦОД, но нет гарантии, что на следующий день вы получите тот же поток воздуха. Поскольку операторы центров обработки данных не знают, как система будет вести себя в изменяющихся условиях, проектировщики центров обработки данных обеспечивают многоуровневую избыточность, чтобы убедиться в том, что ЦОД готов к чему угодно.

Система охлаждения предназначена для управления рисками. Рассматривая ее в данном контексте, AdeptDC использует машинное обучение, чтобы улучшить способы управления рисками и обеспечить более четкое представление о том, что происходит в окружающей среде, стремясь в конечном счете помочь операторам ЦОД избежать чрезмерной избыточности.

Это осуществляется путем определения потребностей в охлаждении на основе источников тепла в инфраструктуре центра обработки данных. Как отметил Гош, температура процессора является наилучшим показателем уровня охлаждения, необходимого для удаления излишков генерируемого тепла.

Система также может считывать температуру графического процессора, если в ЦОД для обслуживания рабочих нагрузок используются вычислительные мощности GPU. При обслуживании связанных с машинным обучением рабочих нагрузок во всем мире во многих случаях требуются высокоплотные кластеры графических процессоров, что способствует ускоренному распространению процессоров этого типа во все большем количестве центров обработки данных .

Операторы центров обработки данных обычно не являются экспертами в области теплового проектирования и управления воздушными потоками. При этом сочетание термической сложности и обработки большого объема данных делают эту задачу оптимальной для машинного обучения.

«Именно тут наше решение на базе искусственного интеллекта и выходит на сцену. Мы обрабатываем данные в режиме реального времени, обеспечивая очень высокую детализацию и низкие задержки при формировании рекомендаций относительно пороговых значений активации инфраструктуры охлаждения. На выходе получается своего рода виртуальный помощник для управления тепловым режимом «, — сказал Гош.

Интеллектуальный помощник

Система AdeptDC может помочь операторам дата-центров при решении и менее значительных проблем. Например, упрощая мониторинг температурного режима внутри конкретного «горячего» или «холодного» коридора, который является источникам проблем. Но она предназначена для охвата всего центра обработки данных. Инструмент также может помочь масштабировать холодопроизводительность по требованию. Как отмечает Гош, если рабочие нагрузки, паттерны размещения оборудования или само оборудование вашего центра обработки данных меняются, система позволит с легкостью адаптировать охлаждение к изменяющейся среде.

Интеллектуальное охлаждение может быть особенно полезным в случае серверных ферм из категории Edge Data Center. Эти компактные серверные фермы, как следует из названия, размещаются в буквальном смысле «на переднем крае», уменьшая расстояние до пользователей. При этом они могут работать в более сложных средах, что усложняет управление тепловым режимом ЦОД, а также в отдаленных местах, где нет персонала / операторов ЦОД.

Интеллектуальное охлаждение серверных ферм из категории Edge Data Center также пригодится в случае необходимости автоматизировать управление дата-центрами. Эта технология будет полезна и в случае банального отсутствия достаточной мощности для запуска более мощной инфраструктуры охлаждения, чем действительно нужно.

Использование программного обеспечения, а не датчиков упрощает установку в удаленных местах и означает, что вам не нужно раскрывать информацию о местоположении ЦОД. Как отметил Гош, это актуально ввиду того, что владельцы многих серверных ферм из категории Edge Data Center обеспокоены физической безопасностью.

Поскольку на долю охлаждения приходится значительная часть расходов на электропитание центра обработки данных, компаниям необходимо понять, на что они тратят эти деньги. Организации, пытающиеся внедрить модели ценообразования на основе фактического использования ресурсов и возврата платежей, могут использовать AdeptDC для понимания того, какие рабочие нагрузки влияют на затраты на охлаждение, а затем учитывать это при формировании бюджетов предприятий. Даже без получения этих конкретных данных, вы можете получить гораздо лучшее представление об эффективности своего центра обработки данных, чем просто изучая коэффициент PUE.

Как отметил Гош, метрика PUE неидеальна и поверхностно. По его словам, с помощью этой метрики можно изучать только электропитание и охлаждение, но при этом не хватает дополнительной информации, касающейся обслуживаемых приложений. Посмотрите, сколько вы вложили, насколько велика операционная прибыль от этих капиталовложений, после чего вы получите бизнес-метрику вроде возврата от инвестиций.

Всего комментариев: 0

Оставить комментарий