Новый алгоритм хранения данных от MIT уменьшит энергопотребление ЦОД на 35%

23 апреля 2013

MITНовое исследование Массачусетского технологического института (MIT) показывает, что благодаря уменьшению количества копий файлов, которые хранятся на серверах в центрах обработки данных, мы можем добиться значительного сокращения потребления электроэнергии в ЦОД. Особенно это актуально для видеороликов, бесчисленные реплики которых заполонили системы хранения данных (СХД) дата-центров.

На данный момент проект носит скорее теоретический характер, но в течение следующего года специалисты из Bell Labs (исследовательский центр корпорации Alcatel-Lucent) и MIT планируют проверить эту идею на практике. Работа ведется с прицелом на скорейшую коммерциализацию перспективной технологии. Специалисты отмечают, что концепция может быть реализована в виде программного обеспечения, которое будет применяться в рамках существующих объектов.

«Такой подход является весьма перспективным способом повышения эффективности дата-центров», говорит Емина Солджанин, научный сотрудник Bell Labs, которая участвовала в проекте MIT. «Это отнюдь не панацея, но данная инициатива имеет крайне высокое значение для дальнейшей минимизации энергопотребления в индустрии ЦОД, и нет никаких препятствий для скорейшей коммерциализации наших наработок».

«Благодаря нашей технологии операторы любого коммерческого дата-центра могут ожидать снижения затрат на электроэнергию на 35 процентов и больше. Если взять среднестатистический по мощности американский ЦОД, то экономия составит около $ 2.8 млн. в год или $ 18 млн. в течение всего срока службы дата-центра», говорит Мюриэль Медар, профессор Научно-исследовательской лаборатории электроники при Массачусетском технологическом институте, которая руководила работой своих коллег в рамках этого проекта и недавно провела анализ затрат.

Так называемые сети хранения данных (Storage Area Network; SAN) в ЦОД характеризуются чрезмерным уровнем избыточности. Благодаря этому интернет-пользователи, просматривающие видео, скачивающие музыку или иной контент, могут комфортно работать и не замечают задержек при подгрузке фалов. Зачастую элементы конкретного видеоролика хранятся на различных дисках в дата-центре, при этом очередная часть ролика буферизуется на компьютере пользователя незадолго до того, как в ней возникнет необходимость. Кроме того, копии каждой части конкретного ролика хранятся на разных дисках, чтобы обеспечить резервирование на случай, если один диск начнет сбоить. Не будем забывать и о том, что один дата-центр часто обслуживает миллионы запросов на видео-контент одновременно. Все это повышает нагрузку на СХД.

Новая технология, получившая название «сетевое кодирование» (Network Coding), позволяет добиться сокращения уровня избыточности, не жертвуя комфортом пользователей. Алгоритмы трансформируют массив данных, из которых и состоит видеоролик или иной элемент контента, в ряд математических функций, которые при необходимости могут описывать не только одну часть видео, но и другие элементы ролика. Так возникает разновидность резервного копирования, которая не предполагает сохранение полных копий данных. Переход на специализированное программное обеспечение в дата-центре позволит кодировать данные, которые хранятся на дисках, с помощью алгоритма MIT и декодировать их, когда от пользователей будут поступать соответствующие запросы.

На запитку серверов и кондиционирование воздуха в ЦОД требуется огромное количество электроэнергии. Согласно данным консалтинговой фирмы McKinsey, к 2020 году энергопотреблением дата-центров возрастет настолько, что их совокупный углеродный след превысит объем парниковых газов, попадающих в атмосферу по вине пассажирской авиации.

Интеллектуальное программное обеспечение для управления инфраструктурой ЦОД – вроде комплектов ПО DCIM — уже продемонстрировало свою полезность в деле минимизации углеродного следа индустрии дата-центров. Многие компании при создании ЦОД также предусматривают возможность использования возобновляемые источники энергии для запитки серверов. Есть несколько способов, позволяющих сделать работу микрочипов и программного обеспечения эффективней и экологичней. Но технология американцев в перспективе позволит избавиться от чрезмерных дисковых массивов, каждый из которых требует электроэнергии и охлаждения, при сохранении требуемого уровня надежности. Более подробное описание новой технологии можно найти по этой ссылке (английский).

Группа ученых под руководством Медар ранее уже предлагала использовать подобную технологию для повышения пропускной способности беспроводных сетей. Но в данном случае решается несколько иная проблема: в беспроводных сетях много трафика тратится на восстановление пакетов, потерянных при передаче из-за плохого качества сигнала. Если вместо этих пакетов будут пересылаться описывающие их математические функции, то необходимость в повторной отправке отбракованных пакетов отпадет, так как мобильное устройство может самостоятельно восстановить недостающие элементы файла с минимальным использованием вычислительных ресурсов. Практика показала, что эта технология позволяет добиться десятикратного роста производительности беспроводных сетей. Не так давно она стала лицензироваться провайдерами.

Всего комментариев: 0

Оставить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *