24 июня 2021

Новые решения РСК: поддержка Intel Xeon Scalable 3-го поколения, RSC Tornado AFS, RSC Storage on-Demand с DAOS и RSC Tornado AI

Группа компаний РСК, ведущий российский и хорошо известный в мире разработчик и интегратор инновационных высокоплотных и энергоэффективных решений для высокопроизводительных вычислений (HPC, high-performance computing), центров обработки данных (ЦОД), облачных платформ и систем хранения данных «по требованию» (storage-on-demand) представила в рамках крупнейшей европейской суперкомпьютерной конференции ISC 2021 Digital Event свои новые решения: вычислительные узлы «РСК Торнадо» на основе новейших процессоров Intel Xeon Scalable 3-го поколения и модулей энергонезависимой памяти Intel Optane серии 200, система хранения RSC Tornado AFS, решение для создания систем хранения данных RSC Storage on-Demand с поддержкой DAOS, а также специализированное решение RSC Tornado AI для создания систем искусственного интеллекта и машинного обучения.

«РСК Торнадо» c Intel Xeon Scalable 3-го поколения

Новое поколение решения «РСК Торнадо» предназначено для выполнения широкого спектра ресурсоемких научных и прикладных задач. Обновленная линейка интегрированных программно-определяемых и реконфигурируемых решений ориентирована на применение как в составе классических высокопроизводительных систем, так и для эффективного хранения и обработки данных, а также для создания систем искусственного интеллекта (Artificial Intelligence, AI), систем машинного и глубокого обучения (Machine Learning, Deep Learning - ML/DL).

Решение «РСК Торнадо» на основе узлов с процессорами Intel Xeon Scalable 3-го поколения обеспечивает наивысшую вычислительную плотность для архитектуры x86 в индустрии с показателем 967,45 ТФЛОПС на стойку (+37% по сравнению с предыдущим поколением), распределенную систему хранения на узлах RSC Storage on-Demand емкостью 2,45 ПБ на шкаф (+36% по сравнению с предыдущим поколением) с пропускной способностью ввода/вывода на уровне 3,67 Тб/сек (в 2 раза больше по сравнению с предыдущим поколением) и лидирующий показатель энергоэффективности со 100% жидкостным охлаждением в режиме «горячая вода» всех электронных компонент. При этом пользователи получают линейную масштабируемость от малых систем в несколько серверов до тысяч серверов в составе больших кластеров или серверных ферм. Также предоставляются дополнительные возможности для оптимизации стоимости конечных решений за счет поддержки открытых стандартов и новых серверных продуктов Intel.

Решение «РСК Торнадо» на основе старших моделей процессоров Intel Xeon Scalable 3-го поколения (до 40 ядер, TDP 270 Вт), модулей энергонезависимой памяти Intel Optane серии 200, твердотельных накопителей Intel SSD и высокоскоростной коммуникационной сети со скоростью передачи данных 200 Гбит/сек обладает передовыми показателями компактности и вычислительной плотности (до 153 узлов в одном стандартном шкафу высотой 42U), а также обеспечивает возможность стабильной работы вычислительных узлов в режиме «горячая вода» при температуре хладоносителя до +65 °С на входе в вычислительные узлы и коммутаторы. Работа в режиме «горячая вода» для данного решения позволяет применить круглогодичный режим free cooling (24x365), используя только сухие градирни, работающие при температуре окружающего воздуха до +50 °С, что, в свою очередь, позволяет полностью избавиться от чиллеров. В результате среднегодовой показатель PUE системы, отражающий уровень эффективности использования электроэнергии, составляет менее чем 1,04, что является выдающимся результатом для HPC-индустрии.  

Система хранения RSC Tornado AFS с функцией высокой доступности

Специалисты РСК представили новую интеллектуальную систему хранения данных RSC Tornado AFS с поддержкой функции высокой доступности для создания систем хранения с большим объемом данных. Решение обеспечивает высочайшую надежность и доступность данных за счет объединения узлов RSC Tornado AFS в функциональные пары. Это позволяет, в случае выхода из строя одного из серверов пары, обеспечить функционирование его элементов хранения с помощью второго сервера. Такой подход позволяет достичь максимальной надежности хранения данных объемом до 2 Петабайт в форм-факторе 2U благодаря использованию 64-х твердотельных дисков Intel SSD P5316 с интерфейсом NVMe в форм-факторе EDSFF.L (так называемый «рулер»). Объем хранения данных в одной стойке, состоящей из 42 узлов RSC Tornado AFS, достигает 41,3 ПБ со скоростью доступа 1 ТБ/c.

В узлах хранения также используются процессоры семейства Intel Xeon Scalable, твердотельные диски Intel Optane SSD и модули энергонезависимой памяти Intel Optane DC Persistent Memory. В RSC Tornado AFS реализовано 100% жидкостное охлаждение в режиме «горячая вода» с рекордно низким показателем эффективности использования электроэнергии PUE на уровне 1,04. 

В многоуровневых системах хранения это решение предназначено для слоя «теплых» данных.

RSC Storage on-Demand с поддержкой DAOS

Решения RSC Storage on-Demand поддерживают файловые системы NFS, Lustre и DAOS для организации распределенной системы хранения. Новая распределенная объектная система хранения с открытым кодом DAOS (Distributed Asynchronous Object Storage) корпорации Intel позволяет обеспечить высочайший уровень скорости работы с данными различных типов. Такое решение ориентировано на применение в области «искусственного интеллекта» (машинного и глубокого обучения). Теперь стало возможным построение не только многоуровневых распределенных систем хранения данных на базе файловой системы Lustre в рамках архитектуры Composable Disaggregated Infrastructure и гибкое управление пулами дисков с интерфейсом NVMe, но и построение СХД на основе DAOS с распределенным внешним пулом дисков NVMe. Такой подход к реализации DAOS позволяет создавать высокопроизводительные системы хранения с гибким соотношением количества объема Intel Optane DC Persistent Memory к объему подключаемых к DAOS-серверу дисков NVMe. Это обеспечивает возможность создания гибких конфигураций «по запросу» для решения конкретной задачи пользователя. Специалисты РСК перенесли свой опыт в построении компонуемых дезагрегированных решений и на управление DAOS. Теперь стало возможным использование удобного пользовательского интерфейса платформы оркестрации «РСК БазИС» для систем на основе DAOS.

RSC Tornado AI

Специализированное решение RSC Tornado AI предназначено для создания систем искусственного интеллекта и машинного обучения. Оно является развитием архитектуры «РСК Торнадо» и представляет собой узел высотой 1U со 100% жидкостным охлаждением на базе двух процессоров архитектуры х86 и до 4-х ускорителей Nvidia A100. Вычислительная производительность одного шкафа, состоящего из 42-х узлов RSC Tornado AI, достигает 1,895 Пфлопс и 104,83/209,66 POPS (INT8/INT4). Решение RSC Tornado AI оптимизировано для работы с распределенной системой хранения RSC Storage on-Demand.

Компонуемо-распределенная архитектура «РСК Торнадо» позволяет создать наиболее эффективное решение под сложную задачу заказчика, состоящую как из частей компьютерного моделирования, так и машинного обучения. Благодаря использованию распределенной системы хранения RSC Storage on-Demand пользователь получает оптимальную конфигурацию, настроенную под тип его задачи и создаваемую за считанные секунды.