Новые алгоритмы помогут снизить углеродный след облачных вычислений

14 января 2014

StratusКонечным пользователям облачные вычислительные платформы могут казаться чем-то эфемерным, но на само деле они имеет вполне осязаемую физическую форму и соответствующий углеродный след. Например, по вине центров обработки данных соцсети Facebook в 2012 году в атмосферу попало 298 000 метрических тонн углекислого газа, что эквивалентно активной эксплуатации примерно 55 000 автомобилей с ДВС на протяжении 12 месяцев.

У нас для вам две новости: хорошая и плохая. Хоровое известие заключается в том, специалисты из Тринити-колледжа и научно-исследовательской лаборатории IBM Research, расположенных в Дублине (Ирландия), разработали весьма эффективные механизмы сокращения углеродного следа облачных вычислительных платформ. Плохая новость в том, что реализация плана исследователей на практике, скорее всего, вызовет снижение скорости передачи информации через интернет и увеличение стоимости облачных сервисов. Работая над группой алгоритмов под общим названием Stratus, команда исследователей смогла смоделировать всемирную сеть подключенных друг к другу дата-центров и понять, каким образом лучше всего следует их эксплуатировать для сокращения выбросов углерода при одновременном обеспечении необходимой вычислительной мощности и скорости передачи данных.

По словам Донала О’Махони, который является профессором компьютерных наук в Тринити-колледже, целью данного проекта работы была оценка IT-нагрузок, поступающих в один из элементов распределенной вычислительной сети (те самые подключенные друг к другу дата-центры) из разных частей земного шара, и последующее перераспределение этих нагрузок с использованием других ЦОД для достижения минимизации углеродного следа или снижения затрат на электроэнергию, необходимую для эксплуатации дата-центров.

При моделировании ученые выбрали сценарий, вдохновленный веб-сервисом Amazon Elastic Compute Cloud (EC2), который входит в инфраструктуру Amazon Web Services и позволяет пользователям получить доступ к вычислительным мощностям в облаке при минимальных затратах времени и усилий. Ирландцы учитывали три ключевых фактора: углеродный след вычислительной деятельности, стоимость электроэнергии и время, необходимое для осуществления вычислений и передачу данных посредством сети. Как известно, работоспособность Amazon EC2 обеспечивают среди прочего дата-центры в Ирландии и американских штатах Вирджиния и Калифорния. Поэтому при создании экспериментальной модели дата-центры было решено разместить аналогичным образом. При этом запросы на обработку данных в эти ЦОД поступали из 34 источников в разных частях Европы, Канады и Соединенных Штатов Америки.

Stratus

Программное обеспечение перераспределяет задачи между дата-центрами для оптимизации энергоэффективности: благодаря алгоритмам для балансировки нагрузки Stratus запросы из разных регионов [кружки] перенаправляются в центры обработки данных [желтые квадраты] с целью минимизации длительности передачи данных туда и обратно, углеродного следа дата-центров или эксплуатационных расходов. (Источник: доклад “Stratus — Load Balancing the Cloud for Carbon Emissions Control”)

Затем команда специалистов из Тринити-колледжа и IBM Research использовала алгоритмы Stratus, чтобы оптимизировать параметры работы сетевой инфраструктуры с учетом любой из трех переменных. Благодаря своим алгоритмам они смогли сократить углеродный след EC2 на 21 процент по сравнению со стандартной схемой балансировки вычислительных нагрузок. Ученые обнаружили, что ключом к снижению выбросов CO2 по вине ЦОД было перенаправлением большего количества запросов в ирландский дата-центр по сравнению с объектами в Калифорнии или Вирджинии. Благодаря развитой оптоволоконной инфраструктуре ЦОД в Ирландии, как правило, принимает запрос и передает ответ значительно быстрее, чем в среднем по массиву распределенной вычислительной инфраструктуры. Так что даже при настройке алгоритмов Stratus на максимально возможное уменьшение углеродного следа (даже в ущерб скорости передачи данных или уровню эксплуатационных расходов), этот дата-центр на 38 миллисекунд быстрее получал запросы и передавал ответы, чем в среднем по массиву.

Исследователи подчеркивают, что результаты эксперимента имеют наибольшую ценность в области представления тенденций, а не прогнозирования реальных значений различных показателей вроде снижения углеродного следа. Некоторые из ключевых выводов в силу ряда причин были преднамеренно обобщены. К примеру, в случае некоторых географических регионов вроде Ирландии найти источники данных по ценам на электроэнергию и интенсивности эмиссии углерода в атмосферу, информация в которых обновляется в режиме реального времени, было относительно легко, тогда как в случае других регионов (включая Соединенные Штаты Америки) были доступны только сезонные или годовые показатели. «Если бы у нас были обновляющиеся в режиме реального времени данные для Калифорнии и Вирджинии, такие расчеты могли бы выглядеть совсем по-другому», говорит научный сотрудник Тринити-колледжа и специалист по сетевой инфраструктуре Джозеф Дойл, который вместе с О’махони и Робертом Шортеном из IBM работал над алгоритмами Stratus

Несмотря на огромные перспективы подобного подхода к минимизации углеродного следа ЦОД, он не лишен своих собственных недостатков. Кристофер Стюарт из Университета штата Огайо (США), который исследует технологии экологически устойчивых облачных вычислений, отметил, что, несмотря на достижения ученых из Тринити-колледжа и IBM Research, а также ряда других специалистов в области разработки эффективных механизмов балансировки нагрузки, хранение данных является еще одним важным фактором, который следует рассматривать в первую очередь. По его словам, для эффективной обработки запросов необходимо накапливать огромные объемы данных на СХД в дата-центре. С учетом того, что размеры передаваемых в ЦОД данных быстро растут, необходимость соответствующего повышения емкости СХД при сохранении и по возможности увеличении скорости ее работы является в настоящее время серьезной проблемой. Иными словами, недостаточно емкие и быстрые системы хранения данных могут значительно ограничить гибкость распределенной вычислительной системы, снижая возможности для перенаправления запросов из одного дата-центра в другой.

Всего комментариев: 0

Оставить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *