Gérer ses jobs sous SLURM

Supprimer un job :

scancel <JOB_ID>

L'accounting slurm correspond à nos utilisateurs sur le cluster + des groupes Linux.

Par conséquent, pour supprimer tous ses jobs, il suffit de lancer :

scancel -u $USER

Voir son historique de jobs :

sacct -u $USER

Avoir des informations sur un job :

squeue -j <JOB_ID>
sacct -j <JOB_ID>
sacct -l -j <JOB_ID>
scontrol show job <JOB_ID>

Merci de penser à remplacer <JOB_ID> par votre numéro de job en supprimant les chevrons (symboles inférieurs < et supérieurs >).

scontrol purge les jobs assez rapidement, contrairement à sacct; pour avoir uniquement quelques colonnes avec sacct sur un job :

sacct  --format=jobid,MaxRSS,MaxVMSize,start,end,CPUTImeRaw,NodeList,ReqCPUS,ReqMem,Elapsed,Timelimit,State,ExitCode -j <JOB_ID>

Pour sacct, voir aussi ou man sacct.

Avoir des informations par partition

# ici, sur la queue small : affichage de vos jobs par état
squeue -u $USER -p small -t RUNNING
squeue -u $USER -p small -t PENDING
squeue -u $USER -p small -t COMPLETED

Info Vous pouvez désormais passer à la section pour utiliser module