
Slrum(슬럼)이란?
: 대규모 컴퓨팅 클러스터에서 작업(job)을 관리하고 스케줄링하는 오픈소스 작업 관리자(Job Scheduler). 리눅스 기반 클러스터에서 활용되는 스케줄러로, 서버 여러대에 있는 GPU등의 리소스를 효율적으로 쓰도록 함.
Slurm Workload Manager - Quick Start User Guide
Quick Start User Guide Overview Slurm is an open source, fault-tolerant, and highly scalable cluster management and job scheduling system for large and small Linux clusters. Slurm requires no kernel modifications for its operation and is relatively self-co
slurm.schedmd.com
slurm 스케쥴러 기본 사용법 (2021.04) | 활용정보
슈퍼컴퓨팅인프라센터 2019. 6. 14. 15:00
docs-ksc.gitbook.io
작업 관련 주요 명령어
- 작업 스크립트 제출
sbatch my_job.sh
- 현재 대기 중이거나 실행 중인 작업 확인
squeue
- 실행 중인 작업 취소
scancel [작업 ID]
- 작업 내용 구체적 확인
scontrol show job
- 클러스터 상태 및 가용 노드 확인
sinfo
- 스크립트 내용
#!/bin/bash
#SBATCH --job-name=example
#SBATCH --output=output.txt
#SBATCH --ntasks=1
#SBATCH --time=01:00:00
#SBATCH --mem=1G
python my_script.py
- 평소에 돌리는 것 처럼 터미널에 python my_script.py 이렇게 돌리면 오류남. bash 스크립트(.sh) 파일 생성해서 sbatch로 돌려야함.
'Issue' 카테고리의 다른 글
[Linux] 가상환경 별 서버 사용량 확인 (0) | 2025.02.10 |
---|---|
[tistory] latex 수식입력 (3) | 2024.03.26 |