Перейти к основному контенту

Централизованное управление GPU вашего датацентра

NVIDIA Data Center GPU Manager Simplifies Cluster Administration | NVIDIA Technical Blog Today’s data centers demand greater agility, resource uptime and streamlined administration to deal with the ever-increasing computational requirements of HPC, hyperscale and enterprise workloads. devblogs.nvidia.com NVIDIA DCGM Manage and Monitor GPUs in Cluster Environments developer.nvidia.com

Централизованное управление GPU вашего датацентра https://devblogs.nvidia.com/parallelforall/nvidia-data-center-gpu-manager-cluster-administration/

#NVIDIA объявила о выходе Data Center GPU Manager (#DCGM) предназанвенного для централизованного мониторинга и управления #GPU и #GPGPU вашего датацентра или кластера (у кого что). ПО имеет интерфейсы к основным игрокам #HPC рынка: Bright Custer Manager (#BCM), #Altair #PBS Works и #IBM Spectrum #LSF и позволяет производить низкоуровневую диагностику аппаратной части, конфигурирование драйверов и прочие низкоуровневые фишки.

Nvidia DCGM 1.0 Release Candidate доступен для скачивания по регистрации (https://developer.nvidia.com/data-center-gpu-manager-dcgm-access). О том, будет ли данное ПО бесплано, или потребуется приобретение лицензий пока не сообщается, но что-то мне подсказывает, что с учетом последних действий NVIDIA нам всем придется раскошелиться.

NVIDIA Data Center GPU Manager Simplifies Cluster Administration https://developer.nvidia.com/data-center-gpu-manager-dcgm-access