Тег: LSF
Напомню, ANSYS RSM позволяет без проблем ставить задачи ANSYS на таких высокопроизводительных системах, как #PBS, #LSF, #GridEngine, #Torque, #MOAB и даже Windows HPC Cluster, но не SLURM.
TotalCAE взяли и написали свой собственный слой интеграции. Это прикольно, но проще было взять стандартный транслятор SLURM-PBS.
#HPC
https://www.totalcae.com/learn/slurm-ansys-remote-solver-manager-rsm/ 🔗 SLURM with ANSYS Remote Solver Manager (RSM) - TotalCAE Blog
http://ift.tt/2zt3EbO https://www.totalcae.com/learn/slurm-ansys-remote-solver-manager-rsm/
Как подружить ANSYS 18 и кластер https://quantumhpc.com/en/blog/how-to-configure-ansys-rsm-v18-with-a-pbs-pro-cluster
Отличная статья/комикс о том, как настроить взаимодействие #ANSYS 18 и кластерного #HPC планировщика очереди задач (#workload manager/#scheduler) #Altair #PBS Pro через новый ANSYS #RSM. Все дело в том, что RSM, утилита взаимодействия решателей ANSYS с вычислительными ресурсам, в 18-ой версии сильно изменилась. Хотя, на мой взгляд, это здорово пошло ей на пользу.
Хоть статья и написана про PBS Pro, но настройка #IBM #LSF, MS HPC Cluster, Grid Engine будет проходить точно также - все настройки унифицированы.
NVIDIA Data Center GPU Manager Simplifies Cluster Administration | NVIDIA Technical Blog
Today’s data centers demand greater agility, resource uptime and streamlined administration to deal with the ever-increasing computational requirements of HPC, hyperscale and enterprise workloads.
devblogs.nvidia.comЦентрализованное управление GPU вашего датацентра https://devblogs.nvidia.com/parallelforall/nvidia-data-center-gpu-manager-cluster-administration/
#NVIDIA объявила о выходе Data Center GPU Manager (#DCGM) предназанвенного для централизованного мониторинга и управления #GPU и #GPGPU вашего датацентра или кластера (у кого что). ПО имеет интерфейсы к основным игрокам #HPC рынка: Bright Custer Manager (#BCM), #Altair #PBS Works и #IBM Spectrum #LSF и позволяет производить низкоуровневую диагностику аппаратной части, конфигурирование драйверов и прочие низкоуровневые фишки.
Nvidia DCGM 1.0 Release Candidate доступен для скачивания по регистрации (https://developer.nvidia.com/data-center-gpu-manager-dcgm-access). О том, будет ли данное ПО бесплано, или потребуется приобретение лицензий пока не сообщается, но что-то мне подсказывает, что с учетом последних действий NVIDIA нам всем придется раскошелиться.
Ограничения есть, но они не такие критичные, как может показаться.
IBM бесплатно предоставляет данную версию HPC Clustre Meanager + Workload Manage + Platfrom MPI + Web UI которая может использоваться на кластерах с 10 узлами. Система способна управлять 1000 заданий!
Между прочим 20 узлов - это от 256 до 1024 ядер процессоров в зависимости от архитектуры узлов!
Service Management Connect - IBM Spectrum LSF Product Family - Downloads