GPU 부하테스트
GPU 하드웨어를 도입했을 때 해당 GPU가 정상적으로 동작을 하는지, 최대 성능으로 작동했을 때 문제는 없는지를 판단하기 위해 부하테스트(stress 테스트)를 실행한다.
리눅스 OS 서버환경에서 GPU의 부하테스트를 진행할 때 gpu-burn의 툴을 사용하여 진행한다.
gpu-burn은 부하테스트를 진행하면서 지속적으로 gpu 온도 정보를 출력해준다.
$ git clone https://github.com/wilicc/gpu-burn
$ cd gpu-burn
$ make
$ ./gpu-burn
위와 같이 gpu-burn 의 git repo를 복제하여 프로그램을 실행하면 쉽게 실행 가능하다.
단 gpu-burn을 실행하기 위해서는 해당 환경의 nvidia driver와 nvcc가 필요하므로 nvidia-cuda-toolkit 까지 설치한다.
https://developer.nvidia.com/cuda-toolkit-archive
CUDA Toolkit Archive
Previous releases of the CUDA Toolkit, GPU Computing SDK, documentation and developer drivers can be found using the links below. Please select the release you want from the list below, and be sure to check www.nvidia.com/drivers for more recent production
developer.nvidia.com
gpu-burn 예제
만약 gpu-burn 명령을 아무 파라미터, 옵션 없이 동작시킨다면 default 값으로 10초만 동작하고 중지된다.
그래서 원하는 시간만큼 동작시키려면 아래와 같이 gpu-burn 뒤에 원하는 초단위를 입력하여 사용할 수 있다.
$ ./gpu-burn 60 #1분 동안 테스트
$ ./gpu-burn 3600 #1시간 동안 테스트
본 포스팅의 내용 및 이미지를 무단 전재, 재배포 또는 복사를 금지합니다.
인용 시 출처와 같이 공개해주세요!
도움이 되셨다면 댓글 또는 공감 부탁드립니다!
'IT > GPU' 카테고리의 다른 글
| [GPU / dcgmi] dcgmi 명령어로 GPU 진단 수행 (0) | 2025.04.16 |
|---|---|
| [GPU] FLOPs와 FLOPS (0) | 2023.10.05 |
| [GPU] CUDA Core란?? NVIDIA 스트림 프로세서 (0) | 2023.10.04 |
댓글