- 쉘 실행자(Shell executor)
- 도커 실행자(Docker executor)
- 도커 머신 실행자(Docker Machine executor)
- 쿠버네티스 실행자(Kubernetes executor)
- GPUs가 활성화되었는지 확인
그래픽 처리 장치(GPUs) 사용
- GitLab Runner 13.9에서 소개되었습니다.
GitLab Runner는 그래픽 처리 장치(GPUs)를 지원합니다. 다음 섹션에서는 각각의 실행자(executors)에서 GPUs를 활성화하기 위한 필요한 구성을 설명합니다.
쉘 실행자(Shell executor)
러너 구성이 필요하지 않습니다.
도커 실행자(Docker executor)
runners.docker
섹션의 gpus
구성 옵션을 사용하세요. 예를 들면:
[runners.docker]
gpus = "all"
도커 머신 실행자(Docker Machine executor)
Docker Machine의 GitLab 포크 문서를 참조하세요. (../executors/docker_machine.md#using-gpus-on-google-compute-engine).
쿠버네티스 실행자(Kubernetes executor)
러너 구성이 필요하지 않을 것으로 예상되지만, 노드 선택기가 GPU 지원 노드를 선택하는지 확인하세요.
GitLab Runner는 Amazon Elastic Kubernetes Service(Amazon EKS)에서 GPU 지원 인스턴스에서 테스트되었습니다.
GPUs가 활성화되었는지 확인
NVIDIA GPU를 사용하는 실행자를 사용할 수 있습니다. NVIDIA GPU의 경우, CI 작업에서 GPU가 활성화되었는지 확인하기 위해 스크립트의 처음에 nvidia-smi
을 실행하는 한 가지 방법입니다. 예를 들면:
train:
script:
- nvidia-smi
GPU가 활성화되어 있는 경우, nvidia-smi
의 출력에서 사용 가능한 장치가 표시됩니다. 다음 예제에서는 단일 NVIDIA Tesla P4이 활성화되어 있습니다.
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 450.51.06 Driver Version: 450.51.06 CUDA Version: 11.0 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 Tesla P4 Off | 00000000:00:04.0 Off | 0 |
| N/A 43C P0 22W / 75W | 0MiB / 7611MiB | 3% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+
하드웨어가 GPU를 지원하지 않는 경우, nvidia-smi
가 실패해야 합니다. 이는 드라이버와 통신할 수 없기 때문이거나 해당 장치가 없는 경우입니다:
modprobe: ERROR: could not insert 'nvidia': No such device
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.