23 июня 2014

РСК на ISC’14: мировые рекорды вычислительной и энергетической плотности RSC PetaStream™ с результатами выполнения приложений заказчиков, новый подход к формированию конфигураций решений на базе кластерной архитектуры «РСК Торнадо»

Группа компаний РСК продемонстрировала на ISC’14 свое революционное сверхплотное массивно-параллельное суперкомпьютерное решение RSC PetaStream™ с прямым жидкостным охлаждением, которое стало еще на 20% производительнее с новым Intel® Xeon Phi 7120D, установив новые мировые рекорды вычислительной – 1,2 ПФЛОПС, и энергетической – 400 кВт – плотности на 1 шкаф. Кроме того, объявлен новый подход к формированию расширенных конфигураций на базе кластерной архитектуры «РСК Торнадо»

 

Лейпциг, International Supercomputing Conference, 23 июня 2014 г. — Группа компаний РСК, ведущий в России и СНГ разработчик и интегратор инновационных решений для сегмента высокопроизводительных вычислений (HPC) и центров обработки данных (ЦОД), сделала целый ряд технологических демонстраций и анонсов на международной конференции-выставке ISC’14 (International Supercomputing Conference), подтверждающих лидирующие позиции РСК в наиболее передовых направлениях развития мировой суперкомпьютерной индустрии.

 

Новые рекорды RSC PetaStream

Компания представила на своем стенде революционное сверхплотное решение RSC PetaStream™ с массивно-параллельной архитектурой и прямым жидкостным охлаждением на основе нового Intel® Xeon Phi7120D, установившее очередной мировой рекорд вычислительной плотности в 1,2 ПФЛОПС на один шкаф при занимаемой площади всего 1 м2. Таким образом, решение RSC PetaStream стало еще на 20% производительнее относительно первой демонстрации этого продукта на ведущей международной выставке SC’13 в Денвере (США) в ноябре 2013 года, когда был установлен предыдущий мировой рекорд вычислительной плотности в 1 ПФЛОПС на один шкаф. Новый технологический прорыв РСК стал возможен благодаря применению в RSC PetaStream сопроцессора Intel® Xeon Phi7120D, выпущенного в марте этого года. Это первое в мире законченное решение на основе Intel® Xeon Phi7120D.

Один шкаф RSC PetaStream содержит 1024 равнозначных вычислительных узла c 250 тысячами потоков на основе Intel® Xeon Phiи обеспечивает отвод до  400 кВт тепловой мощности. Этот показатель в 4 раза выше предыдущего достижения РСК для архитектуры «РСК Торнадо» и также является новым мировым рекордом энергетической плотности.

«Уникальный многолетний опыт специалистов РСК в разработке технологий высокоэффективного прямого жидкостного охлаждения и сверхплотной интеграции суперкомпьютерных решений на базе стандартных серверных компонент позволил нам первыми в мире разработать и представить пользователям сверхплотное массивно-параллельное решение RSC PetaStream на основе недавно выпущенного Intel® Xeon Phi7120D, установив новые мировые рекорды вычислительной и энергетической плотности, а именно достигнув пиковой производительности в 1,2 ПФЛОПС и обеспечив отвод до  400 кВт тепловой мощности на один шкаф на занимаемой площади всего 1 м2», – отметил Алексей Шмелев, исполнительный директор группы компаний РСК.

Решение RSC PetaStream является инновационной реализацией массивно-параллельной архитектуры с использованием лучших из доступных индустриальных компонент высочайшего уровня интеграции и уникальной системной архитектуры для высокопроизводительных вычислений, разработанной специалистами РСК. Каждый узел массивно-параллельного суперкомпьютера является независимым и равнозначным, построен на основе 61-ядерного сопроцессора Intel® Xeon Phi7120D с 16 ГБ высокоскоростной памяти GDDR5 и работает под управлением операционной системы семейства Linux. Все вычислительные узлы системы RSC PetaStream объединены между собой высокоскоростными межсоединениями на базе технологии InfiniBand FDR, обеспечивая революционное сверхплотное высокопроизводительное решение на базе архитектуры x86.

Благодаря использованию архитектуры х86 при создании нового ПО для RSC PetaStream, так и для будущих вычислительных систем, разработчики смогут применять существующие модели программирования, фактически получая возможность запуска уже существующих приложений на суперкомпьютерах экзафлопcного диапазона. В то же время, гибкость архитектуры RSC PetaStream позволяет разрабатывать, оптимизировать и тестировать приложения для работы на будущих системах с массивно-параллельными архитектурами и новыми многоядерными процессорами, а также инновационные модели программирования, которые могут быть более эффективными для экзафлопных вычислений.

В дополнение к высочайшей производительности приложений, которую обеспечивает RSC PetaStream, использование высокоэффективной подсистемы распределения электропитания 400 В постоянного тока с высоким значением КПД и технологии прямого жидкостного охлаждения РСК позволило достичь рекордной вычислительной плотности в 1,2 ПФЛОПС на вычислительный шкаф при занимаемом объеме лишь в 2,2 м3. И позволяет в два раза сократить расход электроэнергии, по сравнению с традиционными кластерными системами, при выполнении задач моделирования с очень высоким уровнем параллелизма.

Все вышесказанное позволило сделать значительный рывок вперед в направлении создания суперкомпьютеров экзафлопcного диапазона, способных обеспечивать миллионы исполняемых вычислительных потоков в одном приложении.

Результаты выполнения приложений заказчиков на RSC PetaStream

          Использование RSC PetaStream на практике уже позволило провести целый ряд перспективных научных исследований, некоторые из которых были представлены на международной суперкомпьютерной конференции ISC’14 в Лейпциге (Германия).

Учеными-исследователями Института вычислительной математики и математической геофизики Сибирского отделения РАН (ИВМиМГ СО РАН) и Новосибирского государственного университета (НГУ) было проведено тестирование на системе RSC PetaStream разработанного ими приложения AstroPhi, моделирующего столкновение галактик.

«Столкновение галактик – это рядовое событие в их эволюции. В среднем любая галактика совершает до десяти столкновений за хаббловское время и считается, что именно столкновения галактик приводят к их многообразию. Суперкомпьютерное моделирование таких процессов – это единственный способ их изучения. В связи с ростом числа суперкомпьютеров с гибридной архитектурой наиболее актуальной становится проблема создания эффективных численных кодов для таких вычислительных платформ. Это невозможно сделать без со-дизайна всей вычислительной технологии. Благодаря инновационным технологиям, разработанных специалистами группы компаний РСК, и предоставленной нам возможности тестирования приложения AstroPhi на мощной вычислительной системе RSC PetaStream с узлами на базе Intel Xeon Phi удалось смоделировать столкновение галактик в рекордном разрешении при использовании более миллиарда расчетных ячеек. Благодаря производительности и масштабируемости RSC PetaStream время вычислений на одном модуле в 6 раз меньше чем на 4 узлах с процессорами Intel® Xeon® E5-2690», – отметили Игорь Черных и Игорь Куликов, научные сотрудники ИВМиМГ СО РАН и НГУ.

Специалисты Санкт-Петербургского государственного политехнического университета (СПбГПУ) и Петербургского института ядерной физики НИЦ "Курчатовский институт" (ПИЯФ НИЦ КИ) провели ряд сложных исследований и достигли новых результатов с помощью системы RSC PetaStream.

Исследование жизненно важных для клетки процессов развития, старения и опухолеобразования требует изучения фундаментальных закономерностей и механизмов регуляции транскрипции генов (процесса считывания генетической информации).

Целью данной работы является изучение различных промежуточных состояний нуклеосом[1] с помощью методов молекулярной динамики (одним из результатов решения являются траектории частиц). Для решения применялся открытый программный комплекс GROMACS[2]. Решение подобных задач требует серьезных вычислительных ресурсов - характерный временной шаг имеет размер 1-2 фс (2 ∙ 10-15 с), при этом ценность представляют наблюдения продолжительностью порядка 100 нс (10-7 c). Исследуемая система содержит большое число точечных зарядов распределенных в объеме, что, как правило, негативно отражается на масштабируемости задачи и преодолевается с помощью подбора параметров решателя.

«Решатель GROMACS оптимизирован под различные аппаратные архитектуры, что позволяет эффективно его использовать на многих суперкомпьютерах, масштабируя до уровня 200 атомов на ядро. В последних версиях GROMACS имеется поддержка native режима для сопроцессора Intel Xeon Phi, что позволяет использовать систему RSC PetaStream. Уже на одном вычислительном модуле RSC PetaStream с процессорами Intel Xeon Phi удалось достичь производительности 4,6 ТФЛОПС и скорости решения 1,9 нс/сутки, что сравнимо с 10-ю двухпроцессорными узлами на базе процессоров Intel Xeon E5-2695 v2. Использование массивно-параллельных систем, таких как RSC PetaStream, открывает возможности исследования более широких масштабов времен (вплоть до миллисекунд) и размеров систем», – поясняют Евгений Петухов, начальник отдела системного программного обеспечения СПбГПУ и Алексей Швецов, младший научный сотрудник Отделения молекулярной и радиационной биофизики ПИЯФ НИЦ КИ.

Международным коллективом исследователей из Университета Хельсинки (University of Helsinki), Института здравоохранения Финляндии (National Institute of health and Welfare), Рыбинского государственного авиационно-технического университета (РГАТУ) выполняется исследование, направленное на выявление причин возникновения и отслеживание динамики развития эпидемии гриппа, имеющей место в 2009-2011 гг. в Финляндии. Исследователи предлагают Байесовскую модель распространения инфекции и ее реализацию на основе принципа выборки по значимости. Первоочередной целью является оценка количества так называемых скрытых (незарегистрированных) случаев болезни. Исследователи используют аппарат математической статистики, поэтому вычислительных мощностей для реализации метода Монте-Карло, дающего оценку правдоподобия заданного набора параметров, априори не может быть в достатке (чем больше выполняется итераций метода, тем точнее получается оценка параметров).

 «Один модуль массивно-параллельной вычислительной системы RSC PetaStream на базе восьми Intel Xeon Phi обеспечивает необходимую производительность для метода MCMC поиска оптимальных траекторий, так как позволяет выполнять симуляцию со скоростью порядка 360000 бросков метода Монте-Карло в секунду. Такая высокая производительность позволяет наиболее точно определять количество скрытых случаев болезни для эффективного прогноза распространения эпидемий и предотвращения пандемий», – утверждает команда исследователей.

Сотрудниками Химического факультета МГУ им. М.В. Ломоносова при поддержке Лаборатории инновационных вычислений Университета Теннеси проведена адаптация библиотеки линейной алгебры MAGMA к новой аппаратной архитектуре и выполнены исследования производительности на системе RSC PetaStream. В ряде тестов достигнутая производительность составила более 60% от теоретической (пиковой) производительности использованной конфигурации RSC PetaStream, что свидетельствует о высокой эффективности разработанного решения. Материалы исследования представлены в докладе, принятом в научную программу, и опубликованы в сборнике статей конференции ISC’14.

 

Расширения базовой архитектуры «РСК Торнадо» для решения различных классов задач

Проанализировав многолетний опыт разработки, внедрения и эксплуатации высокопроизводительных кластерных систем для сегментов рынка HPC и ЦОД, специалисты группы компаний РСК оптимизировали подход к созданию решений на базе проверенной временем кластерной архитектуры «РСК Торнадо» в части реализации подсистемы управления всей вычислительной системой и построения серверных узлов. Это позволило перейти к концепции узла «РСК Торнадо» базовой конфигурации (2-х процессорная конфигурация на основе высокопроизводительных процессоров серии Intel® Xeon® E5-2600 v2) и дополнительных пакетов расширения, наиболее полным образом удовлетворяющих конкретные потребности различных заказчиков.

Например, пакет расширения RSC Tornado HPC Expansion Pack, ориентированный на высокопроизводительные вычисления с использованием двух сопроцессоров Intel® Xeon Phi, позволяет повысить производительность вычислительного узла до 2,93 ТФЛОПС.

Расширение RSC Tornado BigData Expansion Pack предоставляет оптимизированную по соотношению «цена/производительность» конфигурацию для высокопроизводительной обработки данных.

Пакет расширения RSC Tornado VDI Expansion Pack предназначен для задач виртуализации и удаленного доступа к рабочим местам, а также областей CAD/CAM/CAE. Он построен на основе карт AMD FireProS10000 или NVIDIA GRID™ K1/K2 и высокопроизводительного твердотельного накопителя Intel® SSD DC P3700.

Пакет расширения RSC Tornado Security&Protection Expansion Pack разработан специально для заказчиков из учреждений финансового сектора и других, требующих максимальной скорости доступа и защиты данных.

Программно-аппаратный пакет расширения RSC SDM Expansion Pack позволяет реализовать концепцию Software Defined Management, разработанную специалистами РСК, для узлов «РСК Торнадо» и RSC PetaStream, улучшая управляемость и увеличивая доступность вычислительных систем для пользовательских приложений. В рамках данной концепции гибкое объединение управляющих агентов (инфраструктурных компонент, узлов вычислителя, планировщика и библиотек пользовательских приложений) делает возможным создание новых проблемно-ориентированных управляющих приложений (Task Oriented Management Applications, TOMA), позволяющих повысить эффективность использования вычислительного комплекса и снизить эксплуатационные издержки. Одним из примеров является приложение, позволяющее организовать адаптивное управление приоритетами планировщика задач с учетом доступных энергетических ресурсов и реальной мощности системы охлаждения ЦОД для предотвращения останова задач и, как следствие, возможной потери критически важных данных при возникновении временных инфраструктурных сбоев.

Возможно создание и других специализированных пакетов расширения согласно конкретным запросам заказчиков. Применение данного подхода позволило значительно повысить доступность специализированных конфигураций и обеспечить легкость модернизации, сохраняя при этом рекордные показатели компактности, вычислительной и энергетической плотности решений на базе кластерной архитектуры «РСК Торнадо».