참고 블로그:
https://80000coding.oopy.io/d8131e92-bde9-4526-a604-217ef31d5a86
인공지능을 위한 GPU(CUDA 설치)
인공지능 분야에 그저 관심만 있거나 초보 단계 분들에게 적합한 글입니다.
80000coding.oopy.io
https://mz-moonzoo.tistory.com/2
[Environment] Window11 딥러닝 환경 구축
항상 새로운 환경에서 딥러닝 환경을 구축하다보니 매번 비슷한 시행착오를 겪는거 같아서 작성함. 우선 아나콘다는 설치돼있다는 가정하에 시작. 1. GPU모델 확인 및 NVIDA 설정 - 기존에 설치된
mz-moonzoo.tistory.com
예전에 다른 컴퓨터에 시도해보았다가 빙빙 꼬여서 실패해버린 cuda 설치, 이번에는 깔끔한 컴퓨터에 재시도해보려 한다.
로컬에서 딥러닝을 돌리기 위해 산 미니멈 GPU...
코랩으로 연습 및 공부하자니 리소스에 한계가 있어서, GPU를 지른 김에 로컬로 냅다 돌려보자 싶었다.
자 이제부터 빈 컴퓨터에 하나하나 환경설정을 해보자.
본인 컴퓨터 사양 확인
OS: Windows 11
GPU: NVIDIA GeForce RTX 2080
서치 도중, 엄청나게 간단한 블로거 분의 팁을 알아냈다
https://sincerechloe.tistory.com/44
아나콘다 가상환경을 이용해 딥러닝 개발 환경 만들기 (GPU용)
CUDA 툴킷 다운로드하고, GPU를 자유자재로 활용해보자! - NVIDIA Blog Korea 우리가 언어를 매개로 의사소통을 하듯이 기계와 커뮤니케이션을 하기 위해서는 프로그래밍 언어가 필요합니다. 개발자들
sincerechloe.tistory.com
아나콘다 설치하기
* 아나콘다 가상환경 내에서 cudnn, cuda 설치하는 커맨드
- 가상환경 없을 때 만드는 커맨드
conda create -n dlstudy tensorflow-gpu
이게 되네?
conda list
수동 설치법 (추가 필요)
* 문제 인식:
- win10, 가상환경에서 huggingface model 이용하던 중 학습 속도가 느림을 확인하였음
- GPU를 사용할 수 있나 코드로 확인해보기로 함
import torch
print(torch.cuda.is_available()) # True면 GPU 사용 가능, False면 불가능
print(torch.cuda.device_count()) # 사용 가능한 GPU 개수
print(torch.cuda.get_device_name(0)) # 첫 번째 GPU 이름 출력
첫 번째 문장에서 당당하게 False를 반환했다.
False가 리턴되는 경우, 가상환경에서 GPU를 인식하지 못하는 것이라고 한다.
따라서 가상환경에 직접 torch를 설치해주기로 했다.
NVIDIA 사이트에서 CUDA 지원 여부 확인하기
https://developer.nvidia.com/cuda-gpus
CUDA GPUs - Compute Capability
Explore your GPU compute capability and CUDA-enabled products.
developer.nvidia.com
- 웹사이트에서 확인해보자.
GPU 드라이버 설치 확인
nvidia-smi
명령어를 입력해 Driver version을 확인할 수 있다.
내 그래픽카드인 NVIDIA GeForce RTX 2080이 출력되고, 사용/가용 메모리가 나타나고 있다.
가장 위를 보면 내 드라이버의 현재 버전은 556.12이고, CUDA가 12.5까지 지원된다는 뜻.
CUDA 설치 확인
nvcc --version
위 명령어로 설치된 CUDA version을 확인할 수 있다.
해당 명령어가 작동하지 않는다면 CUDA가 설치되지 않은 것이므로, nvidia cuda toolkit에서 적절한 버전의 cuda를 설치하기.
본인은 pytorch로 한 번 성공한 적 있는 CUDA version 12.4를 설치해줬다.
Pytorch 홈페이지에서 설치 가능 버전 확인하기
- pytorch가 cuda를 지원하는 버전으로 설치되었는지 확인하기.
- cuda 버전과 맞게 설치할 것.
공식 문서: https://pytorch.org/get-started/locally/
저 커맨드로 설치하려 하니 희~~한하게 hash error가 떠서 그냥 아래 커맨드로 설치해줬다
설치가 완료되면 다시 torch.cuda.is_available()로 GPU 인식 여부 확인
+ 문제가 또 생겨서...
[WinError 126] 모듈 접근 에러를 만났고, 구글링 해보다가 Visual Studio를 설치해줬더니 인식이 됐다.
https://drawing-thoughts.tistory.com/61
OSError: [WinError 126] 지정된 모듈을 찾을 수 없습니다. (torch\lib\fbgemm.dll)
이번에 데스크탑을 새로 맞췄다. 그래서 프로그래밍 환경을 다시 구성해서 그런지 전에는 발생하지 않던 이상한 문제가 하나씩 발견된다.. 한 라이브러리를 사용하려고 하는데 OSError: [WinError
drawing-thoughts.tistory.com
마지막으로, transformers[torch] 를 설치하라는 출력이 있어서
pip install transformers[torch]
해당 패키지까지 설치해주었다.
이제부터 cuda를 사용할 수 있다 만세~
+
해도 해도 안될때! venv로 만들어서 들어가버리기
가상환경 설정 확인
- 가상환경이 인식하지 못하는 경우: GPU드라이버나 CUDA와 연결을 차단하고 있을 수 있음.
- torch 포함한 라이브러리가 최신인지 확인하기.
- 새로 만들어서 진행하기
python -m venv myenv
source myenv/bin/activate # Windows에서는 myenv\Scripts\activate
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117
'머신러닝-딥러닝' 카테고리의 다른 글
[머신러닝/딥러닝] 딥러닝과 tensorflow(1, 2) (6) | 2024.09.06 |
---|---|
[머신러닝/딥러닝] 기계학습과 인식 (6) | 2024.09.06 |
[딥러닝] seq2seq & Attention (0) | 2024.08.12 |
[딥러닝] RNN & LSTM & Auto-Encoder (0) | 2024.08.12 |
[머신러닝] 데이터 핸들링 & 모형 평가 (0) | 2024.08.09 |