04 декабря 2025

Лаборатория машинного обучения в науках о Земле МФТИ расширила возможности решения своих задач с помощью внешнего массива GPU/TPU-карт RSC ScaleStream-C

В Лаборатории машинного обучения в науках о Земле Московского физико-технического института (МФТИ) начали использовать внешний массив PCIe-коммутации RSC ScaleStream-C (JBOG), в который установлены четыре высокопроизводительные GPU-карты. 

«Это новое техническое решение разработки РСК позволит нам значительно расширить возможности уже имеющихся серверов в области обучения и применения наших моделей искусственного интеллекта в тех задачах, которые мы решаем в нашей лаборатории и совместно с другими лабораториями Центра наук о Земле МФТИ», – прокомментировал Михаил Криницкий, заведующий Лабораторией машинного обучения в науках о Земле МФТИ. 

Основное направление деятельности этой лаборатории – разработка методов, основанных на моделях искусственного интеллекта, для моделирования атмосферы, океана и климата; для обработки данных в фундаментальных и прикладных задачах морской геологии, морской биологии, экологии моря, метеорологии, в области взаимодействия океана и атмосферы, городской микрометеорологии и во многих других сферах исследований в науках о Земле. Лаборатория разрабатывает методы на основе современных и классических методов машинного обучения, включая искусственные нейронные сети. Среди задач, которые решают сотрудники лаборатории: проведение, обслуживание и обработка данных натурных наблюдений и измерений в метеорологии и океанологии, экологический мониторинг; моделирование природных процессов на различных масштабах. Наибольший эффект от применения нового массива GPU-карт RSC ScaleStream-C ожидается в отношении высокоразрешающих базисных (foundation) моделей искусственного интеллекта атмосферы, океана и климата – приоритетном направлении исследований лаборатории.

RSC ScaleStream-C (JBOG) представляет собой внешний массив с коммутатором для подключения GPU/TPU-ускорителей, являясь ключевым компонентом для расширения возможностей вычислительных комплексов. Он предназначен для организации высокопроизводительных систем, состоящих из одного или нескольких серверов и внешних ускорителей. Массив поддерживает установку до 10-ти ускорителей PCIe x16 с возможностью использования карт разной ширины и объединения их мостами, а также подключения до 4-х серверов через внешние кабели на базе стандарта PCIe x16 Gen4.

Внешний массив PCIe-коммутации RSC ScaleStream-C обеспечивает возможность создания программно-определяемых конфигураций GPU и серверных ресурсов. GPU/TPU могут быть динамически перераспределены между подключенными к массиву серверами в процессе работы. Это обеспечивает уникальные возможности по созданию оптимальных конфигураций под нагрузку. За счет динамического перераспределения GPU, утилизация GPU может быть существенно – в некоторых случаях на десятки процентов –  увеличена по сравнению со случаем установки GPU в серверных платформах.

«Внешний массив для PCIe-коммутации RSC ScaleStream-C позволяет объединять в составе одной высокоплотной аппаратной платформы до 10-ти ИИ-ускорителей и существенно наращивать вычислительные ресурсы серверов. В один массив можно подключить до 4-х серверов и, в ходе работы, осуществлять динамическое переподключение ИИ-ускорителей между серверами. Это открывает новые возможности в решении сложных задач в областях высокопроизводительных вычислений, искусственного интеллекта и машинного обучения», – отметил Александр Московский, генеральный директор группы компаний РСК. 

Преимущества внешнего массива RSC ScaleStream-C (JBOG):
•    Форм-фактор: универсальное шасси для 19-дюймовых серверных шкафов высотой 3U.
•    Высокая плотность: возможность установки до 10-ти современных GPU/TPU-ускорителей PCIe x16 в корпус высотой всего 3U. 
•    Эффективность: имеется возможность использования гибридного охлаждения (воздушного и жидкостного) GPU/TPU-ускорителей для эффективного теплоотвода.
•    Высокая надежность: возможность подключения GPU-ресурсов к нескольким серверам обеспечивает отказоустойчивость.
•    Мониторинг и управление: широки возможности мониторинга и гибкие настройки позволяют создавать различные PCIe-конфигурации с GPU/TPU и подключенными серверами.
•    Сохранность инвестиций: независимый жизненный цикл ключевых компонентов (серверов и GPU/TPU-ускорителей) позволяет обновлять их независимо. Возможность модернизации уже развернутого серверного парка.

Дополнительная информация

Продолжая пользоваться сайтом, вы соглашаетесь на обработку файлов cookie с использованием метрических программ. Подробнее