16 ноября 2016

«РСК Торнадо» на процессоре Intel® Xeon Phi™ 7290 устанавливает новый мировой рекорд вычислительной плотности в 1,41 ПФЛОПС на шкаф

Российская группа компаний РСК представила на международной суперкомпьютерной выставке SC16 новое поколение сверхвысокоплотного, масштабируемого и энергоэффективного суперкомпьютерного решения «РСК Торнадо» с прямым жидкостным охлаждением на базе 72-х ядерного процессора Intel® Xeon Phi 7290, установив новый мировой рекорд вычислительной плотности для архитектуры x86 в 1,41 ПФЛОПС на шкаф 

Солт-Лейк-Сити (США), Supercomputing Conference (SC16), 16 ноября 2016 г. — Группа компаний РСК, ведущий в России и СНГ разработчик и интегратор инновационных решений для сегмента высокопроизводительных вычислений (HPC) и центров обработки данных (ЦОД), представила на международной выставке-конференции SC16 (Солт-Лейк-Сити, США) новое поколение своего сверхвысокоплотного, масштабируемого и энергоэффективного  суперкомпьютерного решения «РСК Торнадо» с прямым жидкостным охлаждением (все элементы вычислительного шкафа охлаждаются жидкостью) на базе 72-х ядерного процессора Intel® Xeon Phi 7290, самой старшей модели в этом семействе. Это решение РСК установило новый мировой рекорд вычислительной плотности для архитектуры x86 в 1,41 ПФЛОПС на шкаф, превысив прежнее достижение на 17% (ранее с 2013 года еще одному решению российской компании - RSC PetaStream - принадлежал мировой рекорд в 1,2 ПФЛОПС на шкаф). «РСК Торнадо» на базе многоядерных процессоров семейства Intel® Xeon Phi 7200 обладает улучшенными показателями компактности и вычислительной плотности, высоким уровнем энергоэффективности, а также обеспечивает возможность стабильной работы вычислительных узлов в режиме «горячая вода» при температуре хладоносителя +63° С на входе в вычислительные узлы. Тем самым РСК снова подтвердила свои лидирующие позиции в области выведения на рынок самых передовых технологий для дальнейшего развития мировой суперкомпьютерной индустрии и удовлетворения растущих потребностей заказчиков.

На стенде РСК были продемонстрированы вычислительный узел «РСК Торнадо» на базе многоядерного процессора Intel® Xeon Phi 7290 на серверной плате Intel® S7200AP с установленными двумя твердотельными дисками Intel® SSD DC S3500 Series M.2 емкостью 340 ГБ и одним Intel® SSD DC P3100 (M.2 NVMe) с подключением по интерфейсу PCIe, а также коммутаторы и адаптеры для построения высокоскоростных межузловых соединений Intel® Omni-Path (OPA) и Mellanox EDR InfiniBand.

РСК уже второй год подряд является технологическим спонсором немецкой студенческой команды Технического университета Мюнхена (TUM), снова участвующей в соревновании Student Cluster Competition (SCC), проводимом в рамках международной суперкомпьютерной выставки SC16. В ходе SCC студенческие команды должны продемонстрировать жюри свои познания и практические навыки в области суперкомпьютерных архитектур и повышения производительности программно-аппаратных комплексов путем оптимизации запуска различных научных приложений и тестов на вычислительном кластере, энергопотребление которого не должно превышать лимит в 3120 Вт. Российская компания предоставила в распоряжение этого молодежного коллектива 8-ми узловой кластер, реализованный в мобильном исполнении на базе архитектуры «РСК Торнадо» с прямым жидкостным охлаждением. В составе конфигурации этой вычислительной системы, обеспечивающей стабильную работу узлов в режиме «горячая вода» при температуре хладоносителя до +63° С на входе: 72-х ядерные процессоры Intel® Xeon Phi 7290, серверные платы Intel® S7200AP, твердотельные диски Intel® SSD DC S3500 Series M.2 емкостью 340 ГБ, коммутатор и адаптеры на основе высокоскоростного межузлового соединения Intel® Omni-Path, модули памяти Micron DDR4-2400 VLP емкостью 16-32 ГБ. 

РСК также продемонстрировала решение на базе протокола NVMe-over-Fabric, который позволяет организовать высокоскоростной удаленный доступ к дисковому массиву. Его отличительной особенностью является использование средств RDMA высокоскоростного межузлового соединения Intel® Omni-Path для минимизации задержки доступа к блочному устройству. Так, на стенде РСК был представлен мини-кластер, в котором вычислительные узлы получают дисковое пространство по требованию от централизованного сервера с NVMe-дисками Intel® SSD DC P3700. Такой подход позволяет проектировать кластерные решения высокой плотности, в которых вычислительные узлы имеют ограниченное дисковое пространство с возможностью его расширения через NVMe-over-OPA в реальном времени. Стоит отметить, что решение на базе протокола NVMe-over-Fabric не является заменой традиционным системам хранения в HPC, таким как Lustre, однако, может считаться дисковым ускорителем для оптимизации задач, связанных со случайным доступом к данным.

Особенности архитектуры «РСК Торнадо»:

Новое поколение кластерного решения «РСК Торнадо» отличают следующие улучшенные показатели:

·       использование многоядерных процессоров семейства Intel® Xeon Phi 7200,  в том числе старших моделей Intel® Xeon Phi 7290 (до 72-х ядер) и возможность использования будущих процессоров Intel® Xeon Phi 7250F, Intel® Xeon Phi 7290F (суффикс F для версий процессоров с интегрированным высокоскоростным межузловым соединением Intel® Omni-Path),

·       использование новых серверных плат семейства Intel® Server Board S7200AP,

·       высочайшая физическая плотность с размещением до 408 вычислительных узлов в двухстороннем шкафу 42U с размерами 120х120х200 см,

·       рекордная вычислительная плотность – 1,41 ПФЛОПС (ранее 528 ТФЛОПС для данного решения) в двухстороннем вычислительном шкафу 42U или более 490 ТФЛОПС/м3,

·       энергетическая плотность до 200 кВт/шкаф позволила, за счет снижения энергопотребления системы, повысить энергоэффективность почти в 3 раза,

·       увеличение объема оперативной памяти решающего поля вычислительных узлов одного шкафа почти в 5 раз с 16,3 ТБ в предыдущем поколении до 76,5 ТБ (до 192 ГБ оперативной памяти типа DDR4-2400 RAM и 16 ГБ MCDRAM на узел),

·       одновременное использование до двух твердотельных накопителей с подключением по шине SATA и одного PCIe в форм-факторе M.2, таких как Intel® SSD DC S3500 и Intel® SSD DC P3100 (M.2 NVMe),

·       повышенный уровень энергоэффективности – обеспечены необходимые условия для стабильной работы вычислительных узлов в режиме «горячая вода» при температуре +63 °С на входе в вычислительные узлы, что позволяет реализовать работу системы в режиме «фрикулинга» 24 ч Х 365 дней в году, что позволяет обеспечить PUE системы менее 1,05,

·       новый модуль электропитания в форм-факторе вычислительного узла, обеспечивающий высокоэффективное преобразование 220 В переменного тока в 400 В постоянного тока (эффективность конверсии питания составляет 96%) и возможность параллельной работы на общую шину с резервированием от N+1 до N+N,

·       обновленная конструкция вычислительного шкафа с поддержкой новых технологий высокоскоростных межузловых соединений, включая Intel® Omni-Path и Mellanox EDR InfiniBand,

·       обеспечена возможность построения гибких конфигураций систем охлаждения, с возможностью резервирования, как отдельных узлов гидрорегулирования, так и всей системы в целом,

·       любой узел решения «РСК Торнадо» может обслуживаться индивидуально и не требует остановки какого-либо другого узла. Удобный доступ ко всем компонентам узла (памяти, дискам, адаптерам высокоскоростных  межсоединений, подсистемам управления и электропитания) позволяет легко произвести замену этих компонент или их реконфигурирование прямо на площадке заказчика.

Кроме того, кластерное решение «РСК Торнадо» может быть реализовано и на базе серверных процессоров семейства Intel® Xeon® E5-2600, включая представленную на SC16 старшую модель Intel® Xeon® E5-2699A v4 (22 ядра, тактовая частота 2,40 ГГц, 55 МБ кэш-памяти L3), обеспечивая высокую вычислительную плотность – 258,5 ТФЛОПС в стандартном вычислительном шкафу 42U (80x80x200 см).

Высокая доступность, отказоустойчивость и простота использования вычислительной системы также обеспечиваются благодаря передовой системе управления и мониторинга, реализованной в решениях РСК для высокопроизводительных вычислений. Она позволяет осуществлять управление как отдельными узлами, так и всем решением в целом, включая инфраструктурные компоненты. Все элементы комплекса (вычислительные узлы, блоки питания, модули гидрорегулирования и др.) имеют встроенный модуль управления, что обеспечивает широкие возможности для детальной телеметрии и гибкого управления. Конструктив шкафа позволяет заменять вычислительные узлы, блоки питания и гидрорегулирования (при условии применения резервирования) в режиме горячей замены без прерывания работоспособности комплекса. Большинство компонентов системы (таких, как вычислительные узлы, блоки питания, сетевые и инфраструктурные компоненты и т.д.) представляет из себя программно-определяемые компоненты, позволяющие существенно упростить и ускорить как начальное развертывание, так и обслуживание, и последующую модернизацию системы. Жидкостное охлаждение всех компонентов обеспечивает длительный срок их службы.

Передовые технологические подходы, реализованные в новом поколении суперкомпьютерного решения «РСК Торнадо», позволили уменьшить стоимость инфраструктуры в рамках реализации проектов создания  вычислительных комплексов и обеспечить возможности для более гибкой модернизации, как на уровне отдельного узла, так и всей системы в целом.

Таким образом, решения РСК для высокопроизводительных вычислений де-факто продолжают устанавливать высокие стандарты в отрасли для показателей физической и вычислительной плотности, энергоэффективности,  надежности, доступности и управляемости.

Решения на базе разработанных специалистами компании передовых суперкомпьютерных архитектур «РСК Торнадо» и RSC PetaStream с жидкостным охлаждением находятся в промышленной эксплуатации у российских заказчиков с 2009 и 2013 годов соответственно. Такие решения установлены и активно используются для моделирования и расчетов широкого спектра научно-исследовательских и реальных промышленных задач в Санкт-Петербургском политехническом университете Петра Великого (СПбПУ), Межведомственном суперкомпьютерном центре Российской Академии Наук (МСЦ РАН), Южно-Уральском государственном университете (ЮУрГУ), Московском физико-техническом университете (МФТИ), Росгидромете и у других заказчиков из различных отраслей промышленности.