ВНИМАНИЕ: c 16.03.2022 запуск задач должен осуществляться в подкаталогах ~/_scratch и ~/_scratch2. Запись данных в другие подкаталоги домашнего каталога на вычислительных узлах будет заблокирована.
Каталоги ~/_scratch и ~/_scratch2расположены в отдельных системах хранения: _scratch — на параллельной файловой системе Lustre, _scratch2 — на SSD-дисках. Эти файловые системы также могут быть видны под именами /misc/home1/uXXXX — _scratch и /misc/home6/uXXXX — _scratch2, где uXXXX — логин пользователя.
При запуске задачи пользователя на счет
Запуск программ осуществляется в системе SLURM. Основные команды SLURM приведены в инструкциях ниже. Полная информация выдаётся с помощью команды man
.
В результате запуска задача помещается в очередь заданий и ей присваивается уникальный идентификатор (JOBID). Его можно узнать командами mqinfo
, mps
или squeue
, sacct
.
На основе команд SLURM (которые начинаются с буквы s
) для удобства пользователей (в частности, обеспечения преемственности при переходе на SLURM) были реализованы упрощённые команды запуска MPI-, MATLAB-, ANSYS-программ и информационные команды (начинающиеся с буквы m
).
mqrun
, замена mpirun
, — запуск программы на кластере, аналог команды sbatch
.
mqinfo
— выдача информации об узлах и очереди заданий с помощью команд sinfo
и squeue
( Пример выдачи sinfo
из команд mqinfo
и mps
).mps
или mqinfo -u $USER -l
— выдача информации об узлах и задачах только самого пользователя.mqdel
, mkill
— отмена выполнения задачи (ожидающей старта или уже стартовавшей), действуют как команда scancel
.
Команда mqrun
(замена mpirun
, аналог sbatch
) запускает в пакетном режиме успешно откомпилированную С- или Fortran-программу, например
mqrun -np 8 -maxtime 20 -stdin in.txt mytest
где для mytest затребовано формирование 8 процессов (опция -np
или -n
) с выделением каждому по умолчанию 1950 MB (т.е. -m
1950) и установкой входного файла (-stdin
) при ограничении времени счета 20-ю минутами (–maxtime
или –t
). Так как не указаны опции -stdout
и -stderr
, то стандартными выходными файлами будут автоматически созданные mytest.1/output
, mytest.1/error
.
В ответ в строке вида Submitted batch job 1475
выдаётся уникальный идентификатор (JOBID
) задачи в очереди заданий, здесь 1475. Уникальный идентификатор используется в командах отмены выполнения задания, например
mqdel 1475 #или mkill 1475
Внимание!
1. В каталогах вида имя_программы.номер номера возрастают, начиная с 1. Пользователь должен сам удалять ненужные каталоги.
2. Для выдачи опций mqrun
следует набрать
mqrun -help
3. При необходимости можно указать опции команды sbatch
в качестве значения параметра --slurm-opts
команды mqrun
, например:
mqrun -n 6 -nh 2 --slurm-opts '--ntasks-per-node=3 --gres=gpu:3 -x tesla[49,52]' ./test