머신러닝-딥러닝

[딥러닝] Windows 10/11에서 CUDA 설치하기

옆동네애옹이 2024. 8. 28. 00:45
728x90

참고 블로그:

https://80000coding.oopy.io/d8131e92-bde9-4526-a604-217ef31d5a86

 

인공지능을 위한 GPU(CUDA 설치)

인공지능 분야에 그저 관심만 있거나 초보 단계 분들에게 적합한 글입니다.

80000coding.oopy.io

 

https://mz-moonzoo.tistory.com/2

 

[Environment] Window11 딥러닝 환경 구축

항상 새로운 환경에서 딥러닝 환경을 구축하다보니 매번 비슷한 시행착오를 겪는거 같아서 작성함. 우선 아나콘다는 설치돼있다는 가정하에 시작. 1. GPU모델 확인 및 NVIDA 설정 - 기존에 설치된

mz-moonzoo.tistory.com

 

 

예전에 다른 컴퓨터에 시도해보았다가 빙빙 꼬여서 실패해버린 cuda 설치, 이번에는 깔끔한 컴퓨터에 재시도해보려 한다.

로컬에서 딥러닝을 돌리기 위해 산 미니멈 GPU... 

코랩으로 연습 및 공부하자니 리소스에 한계가 있어서, GPU를 지른 김에 로컬로 냅다 돌려보자 싶었다.

자 이제부터 빈 컴퓨터에 하나하나 환경설정을 해보자.

 

본인 컴퓨터 사양 확인

OS: Windows 11

GPU: NVIDIA GeForce RTX 2080

 

 


서치 도중, 엄청나게 간단한 블로거 분의 팁을 알아냈다

https://sincerechloe.tistory.com/44

 

아나콘다 가상환경을 이용해 딥러닝 개발 환경 만들기 (GPU용)

CUDA 툴킷 다운로드하고, GPU를 자유자재로 활용해보자! - NVIDIA Blog Korea 우리가 언어를 매개로 의사소통을 하듯이 기계와 커뮤니케이션을 하기 위해서는 프로그래밍 언어가 필요합니다. 개발자들

sincerechloe.tistory.com

 

아나콘다 설치하기

* 아나콘다 가상환경 내에서 cudnn, cuda 설치하는 커맨드

- 가상환경 없을 때 만드는 커맨드

conda create -n dlstudy tensorflow-gpu

 

이게 되네?

conda list

문제없이 다운된 것을 확인할 수 있음

 

 

 

 


수동 설치법 (추가 필요)

 

* 문제 인식: 

- win10, 가상환경에서 huggingface model 이용하던 중 학습 속도가 느림을 확인하였음

- GPU를 사용할 수 있나 코드로 확인해보기로 함

import torch

print(torch.cuda.is_available())  # True면 GPU 사용 가능, False면 불가능
print(torch.cuda.device_count())  # 사용 가능한 GPU 개수
print(torch.cuda.get_device_name(0))  # 첫 번째 GPU 이름 출력

 

첫 번째 문장에서 당당하게 False를 반환했다.

False가 리턴되는 경우, 가상환경에서 GPU를 인식하지 못하는 것이라고 한다.

따라서 가상환경에 직접 torch를 설치해주기로 했다.

 

NVIDIA 사이트에서 CUDA 지원 여부 확인하기

https://developer.nvidia.com/cuda-gpus

 

CUDA GPUs - Compute Capability

Explore your GPU compute capability and CUDA-enabled products.

developer.nvidia.com

- 웹사이트에서 확인해보자.

지원이 가능한 것을 확인한다

 

GPU 드라이버 설치 확인

nvidia-smi

nvidia-smi 명령어 통해 NVIDIA driver 설치 확인하기

명령어를 입력해 Driver version을 확인할 수 있다.

내 그래픽카드인 NVIDIA GeForce RTX 2080이 출력되고, 사용/가용 메모리가 나타나고 있다.

가장 위를 보면 내 드라이버의 현재 버전은 556.12이고, CUDA가 12.5까지 지원된다는 뜻.

 

 

CUDA 설치 확인

nvcc --version

위 명령어로 설치된 CUDA version을 확인할 수 있다.

해당 명령어가 작동하지 않는다면 CUDA가 설치되지 않은 것이므로, nvidia cuda toolkit에서 적절한 버전의 cuda를 설치하기.

본인은 pytorch로 한 번 성공한 적 있는 CUDA version 12.4를 설치해줬다.

https://developer.nvidia.com/cuda-12-4-0-download-archive?target_os=Windows&target_arch=x86_64&target_version=11&target_type=exe_local

본인의 플랫폼을 확인한 뒤 설치

 

다시 확인해보았다

 

Pytorch 홈페이지에서 설치 가능 버전 확인하기

- pytorch가 cuda를 지원하는 버전으로 설치되었는지 확인하기.

- cuda 버전과 맞게 설치할 것.

공식 문서: https://pytorch.org/get-started/locally/

이렇게 리스트가 뜬당

저 커맨드로 설치하려 하니 희~~한하게 hash error가 떠서 그냥 아래 커맨드로 설치해줬다

 

설치가 완료되면 다시 torch.cuda.is_available()로 GPU 인식 여부 확인

 

+ 문제가 또 생겨서...

[WinError 126] 모듈 접근 에러를 만났고, 구글링 해보다가 Visual Studio를 설치해줬더니 인식이 됐다.

https://drawing-thoughts.tistory.com/61

 

OSError: [WinError 126] 지정된 모듈을 찾을 수 없습니다. (torch\lib\fbgemm.dll)

이번에 데스크탑을 새로 맞췄다. 그래서 프로그래밍 환경을 다시 구성해서 그런지 전에는 발생하지 않던 이상한 문제가 하나씩 발견된다.. 한 라이브러리를 사용하려고 하는데 OSError: [WinError

drawing-thoughts.tistory.com

 

마지막으로, transformers[torch] 를 설치하라는 출력이 있어서

pip install transformers[torch]

 

해당 패키지까지 설치해주었다.

 

이제부터 cuda를 사용할 수 있다 만세~

 

 

+

해도 해도 안될때! venv로 만들어서 들어가버리기

가상환경 설정 확인

- 가상환경이 인식하지 못하는 경우: GPU드라이버나 CUDA와 연결을 차단하고 있을 수 있음.

- torch 포함한 라이브러리가 최신인지 확인하기.

- 새로 만들어서 진행하기

python -m venv myenv
source myenv/bin/activate  # Windows에서는 myenv\Scripts\activate
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117

 

 

 

728x90