Unix-подобные системы
Команда “watch” оказывает нагрузку на планировщик?
00
Вопрос или проблема У меня есть аккаунт в вычислительном кластере, который использует планировщик SLURM. У меня есть несколько заданий в очереди, и я использую команду “watch”, чтобы видеть их статус: watch squeue -u myUserName Вызывает ли
Убунту
slurm установлен с использованием репозитория ОС. но pmix не включен в “srun –mpi=list”
00
Вопрос или проблема Я устанавливаю slurm из репозитория Ubuntu OS, который доступен в Ubuntu 22.04. Я успешно устанавливаю slurm, но pmix не отображается. root@node1:~# srun --mpi=list srun: MPI types are... srun: none srun: cray_shasta srun: pmi2 Это работает с RHEL8.
Unix-подобные системы
массив заданий с условными операторами
00
Вопрос или проблема Я работаю с массивом заданий, где контролирую возможное выполнение различных шагов скрипта несколько раз. В этом случае только отсутствующие будут обработаны с помощью соответствующих операторов if. В рамках скрипта мне нужно переименовать
Компьютеры и программы
Где находится путь к бинарному файлу slurmd в HPC-системе?
00
Вопрос или проблема Я хочу найти путь к бинарному файлу slurmd в HPC системе. Я использовал which slurmd, но возникла ошибка: /usr/bin/which: нет slurmd в (/opt/xcat/bin:/opt/xcat/sbin:/opt/xcat/share/xcat/tools:/opt/ohpc/pub/mpi/openmpi3-gnu8/3.
Компьютеры и программы
Действительный каталог конфигурации Losf
00
Вопрос или проблема Я начинающий и не знаком с командой losf. Когда я пытаюсь обновить управление ресурсами slurm на HPC кластере, я получаю ошибку: Действительная директория конфигурации LosF не была обнаружена. Вы должны указать действительный путь
Unix-подобные системы
задание массива slurm, выполнить конкретную задачу только один раз
00
Вопрос или проблема Я продолжаю думать о том, как оптимизировать свой рабочий процесс. По сути, у меня есть несколько инструментов, которые будут выполнены на двух гаплотипах (hap1 и hap2) для одного вида растений. Общая структура следующая: >
Unix-подобные системы
slurm: srun и sbatch имеют разную производительность при одинаковых настройках
00
Вопрос или проблема В системе slurm, когда я использую команду srun для запуска программы, она выполняется очень медленно и кажется, что работает только один процессор. srun --pty -A free -J test -N 1 -n 1 -c 1 mpirun -np 16 $FEAPHOME8_3/parfeap/feap -log_summary lu.
Компьютеры и программы
Узел мастер кластера не может найти другие узлы.
00
Вопрос или проблема У меня есть кластер CentOS (версия 7) с несколькими узлами. Проблема в том, что master-узел не распознает их узлы. Я использую slurm 18.08.8. Я использую команду sbatch для запуска своей программы, но получаю следующую ошибку: Узлы
Вопросы и ответы
Служба SLURM slurmd не запускается на кластере Raspberry Pi 5 из-за ошибок разбора cgroup.conf
00
Вопрос или проблема У меня есть кластер Raspberry Pi 5, состоящий из главного узла и рабочих узлов. Я успешно установил SLURM на главном узле и сейчас пытаюсь настроить демон slurmd для работы на рабочем узле. Проблема После настройки SLURM я включил
Системное администрирование и сети
Слurm неправильно распределяет GPU
00
Вопрос или проблема Я использую Slurm 21.08.5, установленный через apt. Мой кластер состоит из 4 GPU машин (nd-gpu[001-005]) с 8 GPU в каждой. Я могу запускать задания следующим образом: srun --gres=gpu:8 nvidia-smi -L И я вижу свои GPU.
Unix-подобные системы
Запуск GNU Parallel на 2 и более узлах с помощником планировщика Slurm
00
Вопрос или проблема Я пытаюсь распределить независимые запуски процесса, используя GNU Parallel на HPC, который использует менеджер заданий Slurm. Кратко, вот как настроен анализ данных: Скрипт#1: myCommands ./myscript --input infile.
Системное администрирование и сети
Поиск и устранение неисправностей для slurm на отдельном ноутбуке с Ubuntu (ReqNodeNotAvail, UnavailableNodes:localhost)
01
Вопрос или проблема Всем. Я новый пользователь Slurm, который хочет установить его на своем ноутбуке с Ubuntu, чтобы использовать команду qsub: (https://www.mcs.anl.gov/petsc/petsc-3.7-atpesc2016/tutorials/HandsOnExercise.html, пожалуйста, посмотрите примеры.