hpc
Data Science
Вопрос или проблема Я сталкиваюсь с проблемами при получении свободного порта в блоке настройки DDP в PyTorch для параллелизации моей задачи обучения глубокому обучению на нескольких GPU в кластере HPC под управлением Linux. Я пытаюсь отправить задачу
Компьютеры и программы
Вопрос или проблема Я начинающий и не знаком с командой losf. Когда я пытаюсь обновить управление ресурсами slurm на HPC кластере, я получаю ошибку: Действительная директория конфигурации LosF не была обнаружена. Вы должны указать действительный путь
Вопросы и ответы
Вопрос или проблема У меня есть snakemake, который задерживается после начала выполнения. У меня есть правила, которые выполняются на кластере (через pbs) и запускают внешний скрипт на Python. Я заметил, что сейчас некоторые из правил задерживаются на