01 октября 2025

Внешний массив GPU/TPU-карт RSC ScaleStream-C расширяет возможности в областях HPC, ИИ и создания гибких платформ для облачных вычислений

Специалисты группы компаний РСК продемонстрировали на отраслевой международной конференции «Суперкомпьютерные дни в России», прошедшей в МГУ имени Ломоносова, внешний массив PCIe-коммутации RSC ScaleStream-C (JBOG), который оптимизирован для установки самых производительных GPU/TPU-карт и предназначен для расширения возможностей серверов с целью решения сложных задач в областях высокопроизводительных вычислений (HPC), искусственного интеллекта (ИИ, AI) и создания гибких платформ для облачных вычислений. Впервые о разработке этого продукта было рассказано в пленарном докладе РСК на конференции ПаВТ 2025 в апреле этого года.


RSC ScaleStream-C обеспечивает возможность создания программно-определяемых конфигураций GPU и серверных ресурсов. GPU/TPU могут быть динамически перераспределены между подключенными к массиву серверами в процессе работы. Это обеспечивает уникальные возможности по созданию оптимальных конфигураций под нагрузку, что особенно востребовано при развертывании облачных сред. За счет динамического перераспределения GPU, утилизация GPU может быть существенно – в некоторых случаях на десятки процентов –  увеличена по сравнению со случаем установки GPU в серверных платформах.


Решение RSC ScaleStream-C (JBOG) обеспечивает достижение производительности до 300 ТФлопс (FP64) на массив, состоящий из 10-ти карт NVIDIA H200.


«Внешний массив для PCIe-коммутации RSC ScaleStream-C позволяет объединять в составе одной высокоплотной аппаратной платформы до 10-ти ИИ-ускорителей и существенно наращивать вычислительные ресурсы серверов. В один массив можно подключить до 4-х серверов и, в ходе работы, осуществлять динамическое переподключение ИИ-ускорителей между серверами. Это открывает новые возможности в решении сложных задач в областях высокопроизводительных вычислений, искусственного интеллекта и создания гибких платформ для облачных вычислений», – отметил Александр Московский, генеральный директор группы компаний РСК. 


RSC ScaleStream-C (JBOG) представляет собой внешний массив с коммутатором для подключения GPU/TPU-ускорителей, являясь ключевым компонентом для расширения возможностей вычислительных комплексов. Он предназначен для организации высокопроизводительных систем, состоящих из одного или нескольких серверов и внешних ускорителей. Массив поддерживает до 10-ти ускорителей PCIe x16 с возможностью использования карт разной ширины и объединения их мостами, а также подключения до 4-х серверов через внешние кабели на базе стандарта PCIe x16 Gen4.

Среди сфер применения этого продукта:
•    Машинное обучение и ИИ: глубокое обучение и инференс, том числе больших языковых моделей.
•    Высокопроизводительные вычисления: научные исследования и моделирование.
•    Анализ больших данных: обработка и анализ крупных наборов данных (Big Data).
•    Виртуализация: GPU/TPU-ресурсов, графического рабочего пространства (VDI).
•    Криптография и блокчейн: майнинг криптовалют и задачи распределенных реестров.

Преимущества внешнего массива RSC ScaleStream-C (JBOG):
•    Форм-фактор: универсальное шасси для 19-дюймовых серверных шкафов высотой 3U.
•    Высокая плотность: возможность установки до 10-ти современных GPU/TPU-ускорителей PCIe x16 в корпус высотой всего 3U. 
•    Эффективность: имеется возможность использования гибридного охлаждения (воздушного и жидкостного) GPU/TPU-ускорителей для эффективного теплоотвода.
•    Высокая надежность: возможность подключения GPU-ресурсов к нескольким серверам обеспечивает отказоустойчивость.
•    Мониторинг и управление: широки возможности мониторинга и гибкие настройки позволяют создавать различные PCIe-конфигурации с GPU/TPU и подключенными серверами.
•    Сохранность инвестиций: независимый жизненный цикл ключевых компонентов (серверов и GPU/TPU-ускорителей) позволяет обновлять их независимо. Возможность модернизации уже развернутого серверного парка.

Некоторые технические характеристики решения RSC ScaleStream-C (JBOG):
- возможность установки до 10-ти графических процессоров NVIDIA H100 или NVIDIA H200 NVL с интерфейсом PCI Express, либо до 10-ти карт PCIe (до 600 Вт);
- связь между графическими ускорителями (GPU Link) обеспечивают высокоскоростные соединения NVLink от NVIDIA для объединения видеокарт в вычислительный кластер;
- до 4-х подключаемых серверов к одному массиву;
- cистема управления и мониторинга на базе Redfish, RESTful API, GUI разработки РСК;
- расширенные функции управления мониторинга;
- тип охлаждения: воздушное (для TPU-карт) или гибридное (для GPU-карт);
- 4 блока питания мощностью 2,2 кВт с выходным напряжением 12 В.

Дополнительная информация

Продолжая пользоваться сайтом, вы соглашаетесь на обработку файлов cookie с использованием метрических программ. Подробнее