목록2024/02/14 (1)
도찐개찐
[Docker] No CUDA GPUs are available
Issue Docker container 만들고 처음엔 학습이 됐는데 갑자기 No CUDA GPUs are available nvidia-smi 찍어보면 Failed to initialize NVML: Unknown Error in Docker after Few hours 호스트가 데몬 다시 로드(또는 유사한 활동)를 수행합니다. 컨테이너가 systemd를 사용하여 cgroup을 관리하는 경우 daemon-reload는 "NVIDIA GPU에 대한 참조가 있는 모든 유닛 파일을 다시 로드하도록 트리거합니다." 그러면 컨테이너가 다시 로드된 GPU 참조에 액세스할 수 없게 됩니다. 문제로 인해 문제가 발생했는지 확인하는 방법 : 컨테이너에 여전히 GPU 액세스 권한이 있는 경우 " host " 터미널을 열..
Infra -------------------------/DOCKER
2024. 2. 14. 12:36