용량이 큰 파일은 github에 올리지 못하다보니, csv를 따로 저장해야하는 일이 생겼다.
하지만 데이터가 너무 많아서 이를 일일히 저장하기 어려웠다.
그래서 linux에서 csv를 한 번에 찾아서 저장할 수 있는 방법을 찾아보았다.
tar(타르) 파일이란?
다수의 파일을 디렉토리 구조, 파일 속성 등을 보존하면서 하나의 파일로 묶는 데 사용되는 파일 형식으로, tar.gz는 tar로 tar로 묶인 파일을 추가로 gzip으로 압축한 파일이다. 파일을 묶는 것과 동시에 압축을 하여 파일 크기를 줄이는 데 유용하다.
tar.gz로 압축하기
tar -zcvf [파일명.tar.gz] [폴더명]
csv파일만 tar.gz로 압축하기
tar -czvf csv_files.tar.gz $(find . -name "*.csv")
- find . -name "*.csv"
- . (현재 디렉터리) 이하를 재귀 탐색
- 이름이 *.csv 인 파일 경로들을 한 줄씩 출력
- $( ... )
- 명령 치환(command substitution): find 의 출력을 스페이스로 구분된 인수 목록으로 치환
- tar -czvf csv_files.tar.gz <파일들>
- tar 명령에 옵션을 붙여서 동작시키는 부분
- -c : create – 새 아카이브 생성
- -z : gzip – 생성된 아카이브를 gzip 으로 압축
- -v : verbose – 처리되는 파일 이름을 화면에 출력
- -f csv_files.tar.gz : 아카이브 파일 이름 지정
- 그 뒤에 명령 치환으로 넘어온 CSV 파일 목록을 차례로 아카이브에 추가
- tar 명령에 옵션을 붙여서 동작시키는 부분
tar.gz 압축풀기
tar -zxvf [파일명.tar.gz]
'Issue' 카테고리의 다른 글
[Linux] Linux에 Anaconda 설치하기 (0) | 2025.05.09 |
---|---|
[Linux] SLRUM 스케줄러 설명 (0) | 2025.03.27 |
[Linux] 가상환경 별 서버 사용량 확인 (0) | 2025.02.10 |
[tistory] latex 수식입력 (3) | 2024.03.26 |