Hi,
ich beobachte in den letzten zwei Wochen eine verstärkte Nutzung der Slurm Nodes, jedoch scheinbar von verschiedenen Personen jeweils begrenzt auf einen oder wenige Nodes.
Ich möchte ich ermutigen, Eure Jobs so zu spoolen, dass Ihr nicht Nodes (nodelist) sondern Bedingungen (constraint) beschreibt. Das könnte nach meiner Einschätzung den Effekt haben, dass Ihr mehr Nodes nutzen könnt und so insgesamt im Falle vieler Jobs schneller fertig werdet, da oft andere User gar keine laufenden Jobs haben.
Habt keine Sorge, dass Ihr andere Jobs damit verdrängt. Der Scheduler sollte eine faire Verteilung der Ressourcen gewährleisten.
Denkt unter anderem an den mem-Parameter, um auch auch nebenläufige single-threaded Jobs auf gemeinsamen Nodes zu ermöglichen, da der Scheduler anderenfalls annimmt, der Job braucht den gesamten Speicher des jeweiligen Node. Zahlreiche Cores bleiben dann ungenutzt.
Lest bitte auch die Wiki-Seite und helft gerne mit, sie zu verbessern:
https://wiki.ibr.cs.tu-bs.de/en/slurm
Viele Grüße -frank