slurm
Unix-подобные системы
Вопрос или проблема У меня есть аккаунт в вычислительном кластере, который использует планировщик SLURM. У меня есть несколько заданий в очереди, и я использую команду “watch”, чтобы видеть их статус: watch squeue -u myUserName Вызывает ли
Убунту
Вопрос или проблема Я устанавливаю slurm из репозитория Ubuntu OS, который доступен в Ubuntu 22.04. Я успешно устанавливаю slurm, но pmix не отображается. root@node1:~# srun --mpi=list srun: MPI types are... srun: none srun: cray_shasta srun: pmi2 Это работает с RHEL8.
Unix-подобные системы
Вопрос или проблема Я работаю с массивом заданий, где контролирую возможное выполнение различных шагов скрипта несколько раз. В этом случае только отсутствующие будут обработаны с помощью соответствующих операторов if. В рамках скрипта мне нужно переименовать
Компьютеры и программы
Вопрос или проблема Я хочу найти путь к бинарному файлу slurmd в HPC системе. Я использовал which slurmd, но возникла ошибка: /usr/bin/which: нет slurmd в (/opt/xcat/bin:/opt/xcat/sbin:/opt/xcat/share/xcat/tools:/opt/ohpc/pub/mpi/openmpi3-gnu8/3.
Компьютеры и программы
Вопрос или проблема Я начинающий и не знаком с командой losf. Когда я пытаюсь обновить управление ресурсами slurm на HPC кластере, я получаю ошибку: Действительная директория конфигурации LosF не была обнаружена. Вы должны указать действительный путь
Unix-подобные системы
Вопрос или проблема Я продолжаю думать о том, как оптимизировать свой рабочий процесс. По сути, у меня есть несколько инструментов, которые будут выполнены на двух гаплотипах (hap1 и hap2) для одного вида растений. Общая структура следующая: >
Unix-подобные системы
Вопрос или проблема В системе slurm, когда я использую команду srun для запуска программы, она выполняется очень медленно и кажется, что работает только один процессор. srun --pty -A free -J test -N 1 -n 1 -c 1 mpirun -np 16 $FEAPHOME8_3/parfeap/feap -log_summary lu.
Компьютеры и программы
Вопрос или проблема У меня есть кластер CentOS (версия 7) с несколькими узлами. Проблема в том, что master-узел не распознает их узлы. Я использую slurm 18.08.8. Я использую команду sbatch для запуска своей программы, но получаю следующую ошибку: Узлы
Вопросы и ответы
Вопрос или проблема У меня есть кластер Raspberry Pi 5, состоящий из главного узла и рабочих узлов. Я успешно установил SLURM на главном узле и сейчас пытаюсь настроить демон slurmd для работы на рабочем узле. Проблема После настройки SLURM я включил
Системное администрирование и сети
Вопрос или проблема Я использую Slurm 21.08.5, установленный через apt. Мой кластер состоит из 4 GPU машин (nd-gpu[001-005]) с 8 GPU в каждой. Я могу запускать задания следующим образом: srun --gres=gpu:8 nvidia-smi -L И я вижу свои GPU.
Unix-подобные системы
Вопрос или проблема Я пытаюсь распределить независимые запуски процесса, используя GNU Parallel на HPC, который использует менеджер заданий Slurm. Кратко, вот как настроен анализ данных: Скрипт#1: myCommands ./myscript --input infile.
Системное администрирование и сети
Вопрос или проблема Всем. Я новый пользователь Slurm, который хочет установить его на своем ноутбуке с Ubuntu, чтобы использовать команду qsub: (https://www.mcs.anl.gov/petsc/petsc-3.7-atpesc2016/tutorials/HandsOnExercise.html, пожалуйста, посмотрите примеры.