Отказоустойчивый решатель
Отказоустойчивый решатель http://www.nektar.info
Одной из проблем очень больших вычислительных систем являются из постоянные сбои. По статистике, у суперкомпьютеров из TOP 10 кажды день только по физическим причинам выходит из строя хотя бы один вычислительных узел. То уж говорить про системы, о которых мечтают ученые, когда говорят про #Exascale. Решатели, которые будут работать на них, должны обладать способностью эффективно обрабатывать падения части #MPI процессов без остановки расчета.
Команда #ExaFLOW в рамках проекта #Nektar++ (http://www.nektar.info) смогла реализовать расширение для MPI, позволяющее в реальном времени эффективно обрабатывать такие сбои. Расширение носит имя User-Level Failure Mitigation (#ULFM).
https://www.nektar.info/ http://www.nektar.info http://www.nektar.info