18 апреля 2022

РСК модернизирует систему хранения данных сверхвысокой плотности для суперкомпьютера «Говорун» в ОИЯИ

Москва, 18 апреля 2022 г. – В Объединенном институте ядерных исследований (ОИЯИ) в Дубне началась установка и внедрение разработанной специалистами РСК интеллектуальной системы хранения данных (СХД) RSC Tornado AFS сверхбольшой плотности (она позволяет хранить 1 петабайт (ПБ) информации в каждом узле высотой 1U). В ней используется 100% жидкостное охлаждение «горячей водой», что позволяет достичь рекордной энергоэффективности и очень высокой плотности монтажа для такого оборудования. Всего в рамках этого этапа плановой модернизации вычислительных мощностей и СХД, начатого в конце 2021 года в Лаборатории информационных технологий (ЛИТ ОИЯИ), вводятся в эксплуатацию 8 узлов хранения данных RSC Tornado AFS общей емкостью 8 ПБ.

Решение RSC Tornado AFS на базе процессоров архитектуры х86 и 32-х твердотельных дисков (емкостью 30 терабайт каждый) с высокоскоростным интерфейсом NVMe в форм-факторе EDSFF E1.L (так называемый «длинный рулер») предназначено для создания систем хранения данных большой плотности класса All-Flash. Интеллектуальная СХД RSC Tornado AFS позволяет хранить до 1 ПБ информации в каждом узле стандартной высоты 1U. В ней реализовано 100% жидкостное охлаждение в режиме «горячая вода» с рекордно низким показателем потребления электроэнергии (PUE) на уровне 1,04.  В многоуровневых программно-определяемых системах хранения RSC Storage on-Demand это решение предназначено для слоя «теплых» данных.

«Группа компаний РСК активно разрабатывает и продвигает собственные решения RSC Storage on-Demand класса Software Defined Storage (SDS). Как ведущий российский производитель суперкомпьютеров и систем хранения данных мы заинтересованы не только в сохранении отечественного рынка высокопроизводительных вычислений и СХД, но и в его развитии. В нынешней непростой ситуации мы продолжаем исполнять текущие контракты и прилагаем все усилия для выполнения обязательств перед своими заказчиками», - подчеркнул Алексей Шмелев, исполнительный директор РСК.

«Данный этап модернизации суперкомпьютера «Говорун» позволяет в несколько десятков раз увеличить сегмент СХД, отвечающий за работу с «теплыми» данными, что обеспечит повышение общей производительности системы хранения в несколько раз. Это, в свою очередь, приведет к ускорению расчетов и сокращению времени решения научных задач в 5-8 раз. Наличие «теплого слоя» СХД позволит еще эффективнее реализовывать расчеты и выполнять исследовательские проекты в сети НИКС, объединяющей центры коллективного пользования (ЦКП) – Объединенного института ядерных исследований, Санкт-Петербургский политехнического университета Петра Великого (СПбПУ) и Межведомственного суперкомпьютерного центра Российской академии наук (МСЦ РАН)», - пояснил Дмитрий Подгайный, начальник сектора ЛИТ ОИЯИ. 

Стоит отметить, что две СХД в составе суперкомпьютера «Говорун» Объединенного института ядерных исследований входят в мировой рейтинг IO500 самых высокопроизводительных системам хранения данных. В текущий список IO500 входит сегмент СХД на базе решения RSC Storage on-Demand с поддержкой новой системы хранения с открытым кодом DAOS – он лидирует среди российских систем хранения данных и занимает 32-ю позицию. Этот пилотный проект на базе DAOS реализован для обработки данных в рамках реализации мегапроекта NICA. Сегмент хранения на базе файловой системы Lustre в ОИЯИ теперь размещается в IO500 на 37-м месте. Уместно напомнить, что СХД суперкомпьютера «Говорун» еще в июне 2018 г., сразу после установки и запуска в эксплуатацию в ОИЯИ, заняла высокое 9-е место в мировом рейтинге IO500.

Система хранения данных в ОИЯИ смогла занять столь высокие позиции в мировом рейтинге IO500 благодаря применению уникальной технологии создания многоуровневых, масштабируемых, распределённых и компонуемых «по требованию» систем хранения данных RSC Storage on-Demand с поддержкой файловых систем NFS и Lustre, а также распределенной системы хранения объектов DAOS.

Вычислительные ресурсы и СХД суперкомпьютера «Говорун» используются для ускорения комплексных теоретических и экспериментальных исследований в области физики высоких энергий, ядерной физики и физики конденсированных сред, в том числе для реализации мегапроекта NICA по созданию на базе ОИЯИ ускорительного комплекса для воссоздания в лабораторных условиях особого состояния вещества, в котором пребывала наша Вселенная в первые мгновения после Большого Взрыва – кварк-глюонную плазму. Реализация этого мегапроекта начата в 2013 году, ввод в эксплуатацию ускорительного комплекса планируется осуществить в 2022 г.

 

Cуперкомпьютер имени Н.Н. Говоруна в ОИЯИ

Суперкомпьютер «Говорун» – первый в мире гиперконвергентный комплекс для высокопроизводительных вычислений со 100% жидкостным охлаждением, созданный специалистами группы компаний РСК в 2018 году и прошедший к настоящему времени уже несколько этапов модернизации. В основе построения гиперконвергентной системы лежит подход объединения ресурсов для вычисления и хранения на каждом узле системы. Это позволяет наиболее эффективно масштабировать общие ресурсы системы с увеличением количества узлов.

Эксплуатация первой очереди суперкомпьютера имени Н.Н. Говоруна позволила провести целый ряд сложнейших ресурсоемких вычислений в области квантовой хромодинамики на решетках для исследования свойств адронной материи при высокой плотности энергии и барионного заряда и в присутствии сверхсильных электромагнитных полей, качественно повысить оперативность моделирования динамики столкновений релятивистских тяжелых ионов, позволил ускорить процесс генерации и реконструкции событий для экспериментов в рамках мегасайенс-проекта NICA, провести расчеты радиационной безопасности экспериментальных установок, существенно ускорить исследования в области радиационной биологии и других научно-прикладных задач, решаемых в ОИЯИ. Результаты данных научных исследований были опубликованы в более чем 50-ти ведущих мировых научных изданиях.

В 2019 году суперкомпьютер ОИЯИ был модернизирован. Обновленная система обладает совокупной теоретической пиковой производительностью 860 ТФЛОПС двойной точности, являясь при этом гиперконвергентной программно-определяемой системой. Данный подход представляется новым для индустрии высокопроизводительных систем, а реализованный с его использованием проект обладает уникальными свойствами по гибкости настройки системы под конкретную задачу пользователя и, тем самым, позволяет существенно повысить эффективность использования ресурсов суперкомпьютера.

Применение гиперконвергентного подхода позволило создать для суперкомпьютера «Говорун» уникальную высокоскоростную систему хранения данных, обладающую лидерскими характеристиками — скорость параллельной файловой системы на чтение/запись информации превышает 300 ГБ/с. Достижение таких показателей стало возможным только благодаря внедрению комплексных программно-аппаратных решений РСК, поскольку применение стандартных технологий построения отдельно стоящих СХД потребовало бы в десятки раз более дорогого решения.

Уникальное внедренное решение системы хранения «по требованию» позволяет на суперкомпьютере «Говорун» формировать специфическую систему хранения для каждой запускаемой на суперкомпьютере задачи с требуемыми свойствами, такими как (объем и скорость, тип файловой системы, время существования, уровень надежности и безопасности), что было бы также невозможно в случае стандартного подхода к построению СХД для высокопроизводительных вычислительных систем.