PUE – по-прежнему полезен?

8 апреля 2013

PUE Необходимость повышения эффективности использования энергии в центрах обработки данных очевидна для всех. Правительства многих стран стремятся помочь операторам ЦОД при реализации потенциала подконтрольных объектов: чиновники предлагают всем желающим воспользоваться налоговыми вычетами, грантами и прочими программами стимулирования. Чтобы рассчитывать на помощь извне, владельцам дата-центров необходимо наглядно продемонстрировать действенность применяемых механизмов повышения энергоэффективности, а для этого нужны универсальные и относительно простые средства сравнительного анализа состояния одного и того же объекта в разрезе определенного периода времени или же универсальные метрики для сравнения одного ЦОД с другими.

С 2007 года разработанный консорциумом The Green Grid коэффициент эффективности использования энергии (Power Usage Effectiveness; PUE) был одним из основных инструментов для решения данной задачи. Но эта метрика по душе отнюдь не всем операторам и владельцам дата-центров. Если вспомнить про все альтернативы (пусть и менее популярные), уже используемые стандарты и перспективные аналоги, которые находятся на стадии разработки, то невольно задумаешься: а действительно ли именно коэффициент PUE является наилучшей метрикой для оценки энергоэффективности дата-центра?

Проблемы при работе с PUE

Сделать выбор в пользу PUE легко, так как данная метрика самая распространенная. Но есть множество сценариев, которые иллюстрируют ее недостатки. Возможно, самым очевидным примером будет ситуация, когда компания обновляет IT-оборудование в своем дата-центре на более энергоэффективные системы, забывая (или оставляя до лучших времен) провести соответствующую оптимизацию подсистем электропитания и охлаждения.

Допустим, изначально мощность установленного в ее ЦОД IT-оборудования составляла 12 МВт, а общая мощность объекта равнялась 20 МВт. Напомним, что PUE соответствует отношению общему энергопотреблению объекта к уровню энергопотребления IT-оборудования (чем значение ближе к единице, тем лучше). То есть PUE в данном случае был равен 1.67. Затем мы установили более энергоэффективные серверы, и мощность IT-оборудования упала до 11 МВт, при этом общая мощность объекта сократилась на все тот же 1 МВт. На выходе наблюдаем рост до PUE 1.72 (19 / 11), а не снижение. Незнакомому с реальной ситуацией на объекте стороннему наблюдателю такая динамика изменения коэффициента будет говорить о том, что объект стал менее эффективным. И это отнюдь не единственный сценарий подробного плана.

В некоторых модульных схемах ЦОД, где используются серверные стойки, применяются крупные стоечные вентиляторы вместо массива малоэффективных маленьких вентиляторов, которые встраиваются непосредственно в серверы. Серверные вентиляторы относят к IT-оборудованию, а вот стоечные – уже к инфраструктуре. В большинстве случаев энергопотребление таких охладителей может достигать существенного уровня, что оборачивается ростом PUE в дата-центрах, где используются стоечные вентиляторы.

Аналогичная ситуация и с электропитанием. Зачастую IT-оборудование предполагает использование отдельного блока питания для каждого сервера, но во многих схемах (например, в случае IBM iDataPlex) используется общий стоечный блок питания. Сама по себе схема крайне удобная и эффективная, и в будущем она будет активно внедряться, но в данном случае энергозатраты на обеспечение работоспособности IT-оборудования вновь переходят в категорию инфраструктуры. В подобной ситуации коэффициент PUE снова будет рассчитываться не совсем корректно.

Маркетинговые манипуляции с PUE

Помимо “подводных камней” метрики у нее есть еще один очевидный минус. Многие крупные компании манипулируют PUE в своих целях, чтобы пропиарить собственные дата-центры. PUE из инструмента для оценки степени повышения энергоэффективности ЦОД превратился в механизм маркетинга. Компании чувствуют давление со стороны рынка и стремятся всеми способами минимизировать свои показатели PUE и, возможно, идут на жульничество.

Например, некоторые операторы дата-центров исключают освещение из общего энергопотребления объекта — в конце концов, свет нужен только людям, а оборудование с его помощью работать эффективнее не станет. Другие операторы измеряются PUE во время зимних месяцев, когда энергопотребление систем охлаждения находится на минимуме.

Но можно ли утверждать, что это всего лишь манипуляции системой? Если да, то в какое именно время следует осуществлять измерения? Можно ли сказать, что измерения, проводимые при максимальной тепловой нагрузке точнее, чем те, которые осуществлялись при минимальной нагрузке? Возможно, измерения следует проводить круглый год, чтобы в итоге получить усредненный уровень. Но погодные условия текущего года могут сильно отличаться от того, что нас ждет в следующем. Аномально высокая длительность зимы в России – яркое тому подтверждение. Кроме того, дата-центры в более прохладных регионах будут иметь неоспоримое преимущество перед теми, которые эксплуатируются в жарком климате.

Еще один пример манипуляций метрикой. В контейнерные ЦОД часто встраиваются кондиционеры CRAH (Computer Room Air Handling) и CRAC (Computer Room Air Conditioning). Таким образом, существенная часть механической инфраструктуры фигурирует в расчетах рассматриваемого коэффициента, как IT-оборудование. В итоге контейнерные ЦОД кажутся более эффективными, чем они есть на самом деле.

Словом, лазеек хватает. Руководство той или иной компании может знать реальный PUE, но клиенты или другие компании, которые хотят сравнить ЦОД конкурента со своим, будут оставаться в неведении.

Тем не менее, несмотря на все проблемы, PUE остается основной метрикой для измерения уровня энергоэффективности дата-центров. Большинство компаний, которые хотят привлечь внимание заинтересованных сторон к продвинутой начинке своих ЦОД, в качестве основного аргумента будут приводить именно коэффициент PUE, а не какой-либо аналог из группы конкурирующих показателей. Остальные метрики были созданы с заметным опозданием, им не хватает пиара, при этом достойным альтернативам PUE крайне сложно выделиться из общей массы. Другими словами, нынешняя популярность PUE означает, что эта метрика вряд ли будет смещена альтернативным показателем в течение ближайшего времени.

У любого подхода есть недостатки

Давайте вспомним, как мы оцениваем интеллект человека. На ум практически сразу же приходит коэффициент интеллекта (Intelligence Quotient; IQ). Это основная метрика для данной цели, но у IQ есть серьезная проблема: это всего лишь число — оценка дается лишь по конечному результату без учета качественного своеобразия умственной деятельности. Иными словами, тест показывает, насколько умен (или глуп) человек, но ничего не говорит о том, в какой области знаний тот умен, и что именно за этой оценкой скрывается.

Проиллюстрируем это на примере. Представьте себе, что нужно оценить уровень интеллекта двух лиц с использованием системы IQ: блестящего музыканта и талантливого математика. Что следует сделать исследователю? Задавать вопросы о музыке? Проверять музыкальные навыки? Задавать вопросы о математике? Попросить испытуемых решить несколько задач? Независимо от того, как исследователь проведет свой тест, результаты будут разными в большинстве случаев. Но тест также может показать, что уровень интеллекта у музыканта и математика одинаковый. Как, скажем, у человека из эпохи Возрождения, который был одинаково хорошо развит в обеих областях. Но отражает ли это умения испытуемых?

В случае PUE наблюдается аналогичная ситуация: это всего лишь число — коэффициент, создатели которого, попытались добиться того, чтобы PUE отражал различные факторы, такие как эффективность инфраструктуры охлаждения и повышение эффективности IT-инфраструктуры. Проблема в том, что эти два фактора могут компенсировать друг друга (как было описано в примерах выше), что, в конечном счете, нивелирует улучшение уровня PUE. Но давайте не будем критиковать лишь только коэффициент эффективности использования энергии. Подобное можно сказать и о большинстве конкурирующих показателей.

Нужно отметить, что некоторые исследователи пытаются решить проблему повышения коэффициента PUE при улучшении энергоэффективности IT-оборудования путем расширения перечня оцениваемых характеристик, что приводило к еще большей путанице. Можно создать различные способы включения этих характеристик в единый коэффициент, но проблема никуда не денется: усовершенствования в одной области без соответствующих доработок в остальных могут обернуться не понижением, а ростом PUE, или (в лучшем случае) весьма посредственными положительными результатами в целом. Попытка использовать одну цифру для оценки эффективности всего дата-центра, это то же самое, что применение IQ, чтобы оценить интеллект: коэффициент может иметь широкое применение, но ему не хватает точности.

Простого и очевидного решения нет

Несомненным плюсом коэффициента PUE и аналогичных ему метрики является их простота: когда вам приходится использовать лишь одну цифру, характеризующую весь дата-центре, вы можете быстро сделать сравнение: центр обработки данных А более эффективен, чем центр обработки данных Б (по крайней мере, согласно общепринятой метрике). Эта простота, как уже упоминалось, превращается в удобный механизм маркетинга. Например, владельцы ЦОД с PUE ниже 1.10 могут быстро и эффективно привлечь к своему проекту внимание средств массовой информации, что приведет к повышению уровня заинтересованности дата-центром и самой компанией среди потенциальных клиентов.

А теперь представьте себе, что вместо одной цифры компании придется создать множество таблиц и объяснить представителям СМИ значения всех граф и элементов. Да, так она сможет предельно точно охарактеризовать уровень эффективности подконтрольного объекта. А вот журналист очень быстро начнет зевать от скуки и отправится искать более яркий материал, потому что лишь немногие читатели будут иметь достаточно терпения, чтобы усвоить всю эту информацию.

Сейчас эксперты консорциума The Green Grid работают над улучшением и уточнением PUE. Другие организации разработали аналогичные показатели, чтобы обойти проблемы PUE, но все эти метрики становятся жертвами сложностей, возникающих в результате попыток свести огромный комплекс характеристик (энергоэффективности) дата-центра к одной цифре. Таким образом, каждая альтернативная метрика может стать мишенью для жульничества и злоупотреблений со стороны недобросовестных компаний, которым нужен маркетинговый козырь.

Нужно четко понять еще одну вещь. Нельзя превращать снижение PUE в самоцель. Главное при работе по оптимизации ЦОД – добиться сокращения совокупных расходов на электроэнергию при сохранении и по возможности приумножении вычислительной мощности. Существует огромное количество механизмов, позволяющий добиться этой цели. Например, достичь прямого снижения энергопотребления IT-оборудования можно с помощью виртуализации, существенно повышающей коэффициент использования серверов, типовое значение которого сегодня находится на недопустимо низком уровне.

Всего комментариев: 1

  • ync
    Автор: ync Добавлено 9 апреля, 2013 в 12:41

    Вот именно для того, чтобы и убрать несоответствия, существует PUE v2. Если измерять по этой методике, то можно привести к единому знаменателю показатели очень разных по архитектуре ЦОДов.
    Плюс к этому для того чтобы что-то измерить, нужно понимать что ты измеряешь. Поэтому существующая методика подходит для измерения эффективности более-менее стандартных архитектур. Всяческие ноу-хау стоят особняком, а их ценность состоит отнюдь не в их энергоэффективности.
    Ну и наконец, PUE — это скоринговая система, позволяющая быстро и в первом приближении оценить определенные параметры. По аналогии с банковским скорингом это не даст 100% результат, но позволит сэкономить время и не влезать в дебри графиков и таблиц.

    Ответить

Оставить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *