본문 바로가기
Issue

[Linux] SLRUM 스케줄러 설명

by hyeonjins 2025. 3. 27.

Slrum(슬럼)이란?

: 대규모 컴퓨팅 클러스터에서 작업(job)을 관리하고 스케줄링하는 오픈소스 작업 관리자(Job Scheduler). 리눅스 기반 클러스터에서 활용되는 스케줄러로, 서버 여러대에 있는 GPU등의 리소스를 효율적으로 쓰도록 함.

 

Slurm Workload Manager - Quick Start User Guide

Quick Start User Guide Overview Slurm is an open source, fault-tolerant, and highly scalable cluster management and job scheduling system for large and small Linux clusters. Slurm requires no kernel modifications for its operation and is relatively self-co

slurm.schedmd.com

 

 

slurm 스케쥴러 기본 사용법 (2021.04) | 활용정보

슈퍼컴퓨팅인프라센터 2019. 6. 14. 15:00

docs-ksc.gitbook.io

 

 

작업 관련 주요 명령어

- 작업 스크립트 제출 

sbatch my_job.sh

 

- 현재 대기 중이거나 실행 중인 작업 확인

squeue

 

- 실행 중인 작업 취소

scancel [작업 ID]

 

- 작업 내용 구체적 확인

scontrol show job

 

- 클러스터 상태 및 가용 노드 확인

sinfo

 

-  스크립트 내용

#!/bin/bash
#SBATCH --job-name=example
#SBATCH --output=output.txt
#SBATCH --ntasks=1
#SBATCH --time=01:00:00
#SBATCH --mem=1G

python my_script.py

 

- 평소에 돌리는 것 처럼 터미널에 python my_script.py 이렇게 돌리면 오류남. bash 스크립트(.sh) 파일 생성해서 sbatch로 돌려야함. 

 

 

 

'Issue' 카테고리의 다른 글

[Linux] 가상환경 별 서버 사용량 확인  (0) 2025.02.10
[tistory] latex 수식입력  (3) 2024.03.26