Дубна, 14 сентября 2018 г. — Группа компаний РСК, ведущий мировой разработчик и интегратор инновационных сверхплотных, масштабируемых энергоэффективных решений для высокопроизводительных вычислений (HPC) и центров обработки данных (ЦОД), продемонстрировала на международной конференции GRID 2018, проведенной 10-14 сентября на базе Лаборатории информационных технологий (ЛИТ) Объединенного института ядерных исследований (ОИЯИ), гиперконвергентное HPC-решение на базе архитектуры «РСК Торнадо» и новых твердотельных дисков Intel® SSD DC P4511 (NVMe, M.2) и Intel® Optane™ SSD DC P4800X M.2 Series с Intel® Memory Drive Technology (IMDT).
Сочетание Intel® Optane™ SSD с Intel® Memory Drive Technology фактически интегрирует преимущества твердотельного диска в подсистему памяти, обеспечивая операционной системе прозрачный доступ к гибридной памяти большего объема, позволяющей более активно использовать большие наборы данных, а также снизить накладные расходы. Новые твердотельные диски Intel® SSD DC P4511 Series, созданные с использованием технологии Intel® 3D NAND, обеспечивают высокую емкость, производительность и энергоэффективность, что позволяет оптимизировать создание самых современных центров обработки с высокоэффективными системами хранения данных. При этом возрастает производительность на один сервер, минимизируется вероятность возникновения сбоев и повышается эффективность дальнейшего масштабирования. Благодаря применению всех этих новых технологий Intel гиперконвергентное решение «РСК Торнадо» обеспечивает HPC-пользователям повышенную гибкость и эффективность за счет предоставляемой возможности применения высокопроизводительной памяти большей емкости с улучшенными характеристиками.
Гиперконвергентный серверный узел «РСК Торнадо» с прямым жидкостным охлаждением хорошо сбалансирован для применения в решении самых различных вычислительных задач и может быть составной частью системы хранения данных, формируемой «по требованию» на базе различных файловых систем, например, таких как Lustre (Lustre-on-demand). Вычислительный узел «РСК Торнадо» может включать до 12-ти твердотельных дисков (одного из вышеуказанных типов), процессор семейства Intel® Xeon® Scalable и серверную плату Intel® Server Board S2600BP. Таким образом, на базе одного узла может быть создана система хранения данных объемом до 24 ТБ с высокой пропускной способностью и низкой латентностью. Объемы хранения будут расти по мере появления на рынке твердотельных дисков более высокой плотности. Гиперконвергентная архитектура «РСК Торнадо» поддерживает различные типы высокопроизводительных систем хранения на базе SSD, формируемые «по требованию», включая создание разделов на базе файловой системы Lustre и обеспечивая интеграцию с различными планировщиками HPC-задач.
РСК продемонстрировала на конференции GRID 2018 универсальное гиперконвергентное и высокоплотное решение «РСК Торнадо» на базе полного набора компонент для создания современных кластерных вычислительных систем различного масштаба с 100% жидкостным охлаждением в режиме «горячая вода», включая высокопроизводительные вычислительные узлы на базе старших моделей процессоров Intel® Xeon® Platinum и Intel® Xeon® Gold (входящих в состав семейства Intel® Xeon® Scalable), серверных плат Intel® Server Board S2600BP, с установленными на них высокоскоростными твердотельными дисками с интерфейсом NVMe в высокоплотных форматах М.2, включая новейшие Intel® Optane™ SSD DC P4800X Series. В состав решения «РСК Торнадо» входит коммутатор Intel® Omni-Path Edge Switch 100 Series со 100% жидкостным охлаждением, что позволяет обеспечить высокую эффективность работы системы охлаждения в режиме «горячая вода» и наиболее низкую совокупную стоимость владения системой.
Решение «РСК Торнадо» на базе серверных процессоров Intel обладает передовыми показателями компактности и вычислительной плотности (до 153 узлов в одном стандартном шкафу 42U), высоким уровнем энергоэффективности, а также обеспечивает возможность стабильной работы вычислительных узлов в режиме «горячая вода» при температуре хладоносителя до +65 °С на входе в вычислительные узлы и коммутаторы. Работа в режиме «горячая вода» для данного решения позволяет применить круглогодичный режим free cooling (24x365), используя только сухие градирни, работающие при температуре окружающего воздуха до +50 °С, что, в свою очередь, позволяет полностью избавиться от чиллеров. В результате среднегодовой показатель PUE системы, отражающий уровень эффективности использования электроэнергии, составляет менее чем 1,06, что является выдающимся результатом для HPC-индустрии.
Высокая доступность, отказоустойчивость и простота использования вычислительных систем, созданных на базе решений РСК для высокопроизводительных вычислений, также обеспечиваются благодаря передовой системе управления и мониторинга на базе интегрированного программного стека «РСК БазИС». Эта система является открытой и легко расширяемой платформой, созданной на основе ПО с открытым исходным кодом и микроагентной архитектуры.
Она позволяет осуществлять управление как центром обработки данных в целом, так и отдельными его элементами, такими как: вычислительные узлы, коммутаторы, инфраструктурные компоненты, задачи и процессы. Все элементы комплекса (вычислительные узлы, блоки питания, модули гидрорегулирования и др.) имеют встроенный модуль управления, что обеспечивает широкие возможности для детальной телеметрии и гибкого управления. Конструктив шкафа позволяет заменять вычислительные узлы, блоки питания и гидрорегулирования (при условии применения резервирования) в режиме горячей замены без прерывания работоспособности комплекса. Большинство компонентов системы (таких, как вычислительные узлы, блоки питания, сетевые и инфраструктурные компоненты и т.д.) являются программно-определяемыми, что позволяет существенно упростить и ускорить как начальное развертывание, так и обслуживание, и последующую модернизацию системы. Жидкостное охлаждение всех компонентов обеспечивает длительный срок их службы.
В составе «РСК БазИС» имеются функциональные возможности по мониторингу и управлению территориально распределенными центрами обработки данных.
Специалисты РСК выступили на GRID 2018 с развернутыми докладами на темы:
• «РСК Торнадо» – гиперконвергентное решение для вычислений будущего,
• «РСК БазИС» – микроагентная платформа для управления вычислительными кластерами.
• Система хранения данных «по требованию» (storage-on-demand): гиперконвергентное решение «РСК Торнадо» для работы с большими наборами данных.
Суперкомпьютер «Говорун» в ОИЯИ
У специалистов РСК накоплен большой опыт в создании и внедрении вычислительных кластеров с интегрированными системами хранения данных на базе твердотельных дисков Intel. Например, в этом году в Объединенном институте ядерных исследований в Дубне специалистами РСК был запущен первый в мире гиперконвергентный суперкомпьютер со 100% жидкостным охлаждением на «горячей воде» на базе решения «РСК Торнадо» с системой хранения данных на основе Intel SSD и под управлением интегрированной программной платформы «РСК БазИС». Эта система заняла высокое 9-е место в текущей редакции списка IO500 (июнь 2018 г.), нового индустриального рейтинга для систем хранения данных HPC-класса.
Суперкомпьютер имени Н. Н. Говоруна предоставил ученым ОИЯИ новые возможности для проведения ресурсоемких, массивно-параллельных расчетов для решения задач в области решеточной квантовой хромодинамики, исследования свойств адронной материи при высокой плотности энергии и барионного заряда в присутствии сверхсильных электромагнитных полей, качественно повысить оперативность моделирования динамики столкновений релятивистских тяжелых ионов, исследования свойств сильно-коррелированных систем в области физики новых материалов, разработки и адаптации программного обеспечения для мегапроекта NICA на новые вычислительные архитектуры, создания передовой программно-аппаратной среды для высокопроизводительных вычислений и моделирования сложных научных задач, а также позволит готовить ИТ-специалистов по всем необходимым направлениям.
Для всех желающих участников конференции GRID 2018 были организованы экскурсии для знакомства с суперкомпьютером «Говорун» в ОИЯИ.