В рамках участия группы компаний РСК в качестве Золотого спонсора в отраслевой международной конференции «Суперкомпьютерные дни в России», прошедшей 29-30 сентября в МГУ имени Ломоносова, были представлены новые высокоплотные решения для выполнения сложных задач в областях высокопроизводительных вычислений (HPC), машинного обучения (ML) и искусственного интеллекта (ИИ, AI). Генеральный директор группы компаний РСК Александр Московский сделал пленарный доклад «Развитие компонуемых решений РСК для высокопроизводительных систем и ЦОД», рассказав о сервере «РСК Экзастрим ИИ» с 8-ю GPU-ускорителями и внешнем массиве PCIe-коммутации RSC ScaleStream-C (JBOG), который оптимизирован для установки самых производительных GPU/TPU-карт.
Производительность высокоплотного серверного решения «РСК Экзастрим ИИ» c 8-ю графическими ускорителями NVidia H100 и прямым жидкостным охлаждением составляет 208 Тфлопс (FP64). При установке 21 сервера в шкаф «РСК Экзастрим» можно достичь пиковой производительности 4,36 Пфлопс (FP64).
Два серверных узла «РСК Экзастрим ИИ» были недавно установлены в суперкомпьютер «Говорун», созданный в 2018 году в Лаборатории информационных технологий им М.Г. Мещерякова Объединенного института ядерных исследований (ЛИТ ОИЯИ) в Дубне.
Внешний массив PCIe-коммутации RSC ScaleStream-C обеспечивает возможность создания программно-определяемых конфигураций GPU и серверных ресурсов. GPU/TPU могут быть динамически перераспределены между подключенными к массиву серверами в процессе работы. Это обеспечивает уникальные возможности по созданию оптимальных конфигураций под нагрузку, что особенно востребовано при развертывании облачных сред. За счет динамического перераспределения GPU, утилизация GPU может быть существенно – в некоторых случаях на десятки процентов – увеличена по сравнению со случаем установки GPU в серверных платформах.
Массив RSC ScaleStream-C поддерживает до 10-ти ускорителей PCIe x16 с возможностью использования карт разной ширины и объединения их мостами, а также подключения до 4-х серверов через внешние кабели на базе стандарта PCIe x16 Gen4.
Решение RSC ScaleStream-C обеспечивает достижение производительности до 300 Тфлопс (FP64) на массив, состоящий из 10-ти карт NVIDIA H200.