Централизованное управление GPU вашего датацентра
NVIDIA Data Center GPU Manager Simplifies Cluster Administration | NVIDIA Technical Blog
Today’s data centers demand greater agility, resource uptime and streamlined administration to deal with the ever-increasing computational requirements of HPC, hyperscale and enterprise workloads.
devblogs.nvidia.com
NVIDIA DCGM
Manage and Monitor GPUs in Cluster Environments
developer.nvidia.comЦентрализованное управление GPU вашего датацентра https://devblogs.nvidia.com/parallelforall/nvidia-data-center-gpu-manager-cluster-administration/
#NVIDIA объявила о выходе Data Center GPU Manager (#DCGM) предназанвенного для централизованного мониторинга и управления #GPU и #GPGPU вашего датацентра или кластера (у кого что). ПО имеет интерфейсы к основным игрокам #HPC рынка: Bright Custer Manager (#BCM), #Altair #PBS Works и #IBM Spectrum #LSF и позволяет производить низкоуровневую диагностику аппаратной части, конфигурирование драйверов и прочие низкоуровневые фишки.
Nvidia DCGM 1.0 Release Candidate доступен для скачивания по регистрации (https://developer.nvidia.com/data-center-gpu-manager-dcgm-access). О том, будет ли данное ПО бесплано, или потребуется приобретение лицензий пока не сообщается, но что-то мне подсказывает, что с учетом последних действий NVIDIA нам всем придется раскошелиться.
NVIDIA Data Center GPU Manager Simplifies Cluster Administration https://developer.nvidia.com/data-center-gpu-manager-dcgm-access