РСК ЦОД для HPC/AI

Области применения РСК ЦОД для HPC/AI: для организаций, на постоянной основе занимающихся научными, инженерными, конструкторскими высокопроизводительными вычислениями и созданием цифрового контента, задачами машинного обучения, обработкой Больших Данных и всего этого вместе в различных сочетаниях, желающих иметь полный контроль над вычислением задач, их результатами и хранением данных в ЦОД, обеспечить централизованное и безопасное управление всеми процессами, а так же построить филиальную сеть малых ЦОД. Решение РСК ЦОД позволяет в достаточно короткие сроки с минимальными капитальными затратами развернуть полнофункциональный вычислительный комплекс на минимальной площади, с максимальной энергоэффективностью, гибко настраиваемый под задачи пользователя с полностью готовой инфраструктурой охлаждения, энергопитания, пожаротушения, безопасности и прочего. Решение масштабируется от одного до множества шкафов с компонуемой архитектурой серверов и системы хранения.

Решаемые задачи: высокопроизводительные вычисления (HPC), работа с 2/3D-графикой (CG), задачи машинного обучения (ML/DL) и искусственного интеллекта (AI) и другие благодаря гибким возможностям конфигурирования и расширения.

Универсальность: РСК ЦОД включает в себя все необходимые программно-конфигурируемые подсистемы современного вычислительного кластера, такие как: поле мощных серверов, гиперконвергентная архитектура, быстрая система хранения с технологией Storage-on-Demand, коммуникационные и сервисные сети, подсистема электропитания, охлаждения и управления РСК БазИС.

По желанию заказчика РСК ЦОД комплектуется высокопроизводительной системой хранения данных (СХД), системами контроля уровней доступа (СКУД), бесперебойного питания (ИБП), пожаротушения и другими.

Основные преимущества

  • Производительность до 0,95 ПФЛОПС на один вычислительный шкаф на процессорах x86 и до 1,930 ПФЛОПС с графическими ускорителями.
  • Компактность (до 153 двухпроцессорных узлов в одном шкафу с форм-фактором 42U 0,8×0,8×2,0м). Сокращение площади ЦОД в несколько раз по сравнению с решением с воздушным охлаждением.
  • Использование архитектуры x86 и VLIW
  • Использование процессоров Intel® Xeon® Scalable Processors (включая старшие)
  • Использование процессоров МЦСТ Эльбрус 4С/8C/8СМ
  • Энергоэффективность (Power Usage Effectiveness = 1,06) не более 6% энергопотребления на охлаждение системы. Охлаждение горячей жидкостью до 60 ºС, работа в режиме Free Cooling круглый год.
  • Высокая экономическая эффективность, снижение ТСО
  • Полностью независимые вычислительные узлы
  • Высокая масштабируемость — до сотен ПФЛОПС/ПОПС
  • Высокая надежность и низкий уровень шума, благодаря использованию технологии жидкостного охлаждения РСК и отсутствию подвижных частей
  • Отсутствие необходимости установки систем кондиционирования воздуха

Инфраструктура в составе решения

Инфраструктура для жидкостного охлаждения максимально ориентирована на оптимизацию затрат и простоты внедрения. В основе инфраструктуры стоит модульность как системы холодоснабжения, так и системы электроснабжения. Система холодоснабжения разрабатывается таким образом, чтобы имелась возможность плавного наращивания производительности при помощи установки насосных блоков в соответствии с реальной нагрузкой со стороны вычислительного оборудования. Таким образом, при помощи модульности системы холодоснабжения, на первых этапах внедрения имеется возможность создать сбалансированное решение, обеспечивающее текущие потребности в охлаждении, но при этом, позволяющее без остановки увеличить мощности простым добавлением модулей системы охлаждения и электроснабжения. Инфраструктура системы жидкостного охлаждения создается на основе многократно проверенных модулей, которые имеют запатентованную схему охлаждения и управления, позволяющую затрачивать на охлаждение ровно столько электроэнергии, сколько требуется по фактической нагрузке на вычислительных элементах и их фактическом количеству.

Управление и мониторинг

Система автоматического управления для инфраструктуры является модульной, но индивидуально настраиваемой для каждого объекта. Благодаря множеству встроенных блоков и элементов контроля, система АСДУ может быть использована как независимый мониторинг с информированием при помощи СМС, или как система безопасности с функцией отключения обслуживаемых элементов при критических ситуациях. Все модули инфраструктуры отображаются в системе управления в реальном времени с указанием всех важных параметров. Централизованное управление осуществляется с помощью платформы РСК БазИС.