AWS EC2로 클라우드 GPU 사용하기

yun·2023년 11월 30일
1

AWS

목록 보기
1/3

역시 초기에는 코랩Colab 같은 무료 GPU만 사용해도 될 것만 같습니다. 이런 팝업을 보기 전까지는..

밤에 딥러닝을 돌려놓고 모델 하나라도 더 만들어 놓고 싶었지만 새벽에 깨보니 당연하게도 epoch 31회차에 런타임은 튕겨있고, model 저장경로를 따로 설정하지 않은 탓에 학습한 모델도 안 남아있었습니다. 그리고 아침에 혹시나 하고 들어가 봤더니 역시나 사용 제한으로 GPU 연결이 안됨.

로컬 GPU로 돌리자니 딥러닝 하는 중엔 컴퓨터를 전혀 쓸 수가 없어서 낮에 개발을 할 거라면 딥러닝은 못한다고 보는 게 맞습니다. 사실 전부터 코랩에서는 도커를 사용할 수 없어서 클라우드 GPU를 찾던 차, 드디어 지르기로 했습니다.

↓ 푼돈인 전재산을 들고 GPU를 지르는 나의 모습

근데 뭘 어떻게 지르면 되나요??

너무 많은 선택지 ㅠㅠ

구글신에게 물어봅니다.

프로젝트용 학습이고 업무용이 아니라서 멀티 GPU까지는 무리 ㅠㅠ

코랩에서 제공하는 T4 정도만 있으면 될 것 같은데요.

가격을 보면 g4ad가 가장 좋지만

g4ad에서 제공하는 그래픽카드는 AMD Radeon Pro V520. 그러니까 고용량 영상 작업에 더 어울리는 GPU라고 할 수 있겠습니다. T4도 파라미터가 많은 모델(yolo v8 x라거나.. l이라거나..) 학습 중에는 꺼질 수 있다는 걸 감안하면, (* 간혹 작은 모델이 더 적합한 학습도 있지만) g4dn으로 T4 정도는 쓰는 게 좋겠어요.

가격 다시 한 번 보고 ㅠㅠ

가장 저렴한 우분투를 사용해도 시간당 0.70 USD
그러니까 12시간만 학습해도 8.40 USD


종료된 인스턴스에는 과금을 하지 않지만 실수로 백업을 남기거나 Elastic IP address, EBS 연결을 해두지 않도록 조심해야 합니다. 자기 자신에게 하는 말

근데 인스턴스 생성 후 nvidia부터 다시 설치해야 하나요?

Deep Learning AMI GPU PyTorch를 가져와 봅니다. 안되면 삽질 좀 하면 됩니다

그리고 Launch 버튼 누르자마자 시작된 삽질

현재 CPU를 1개 사용할 수 있는데 g4dn 인스턴스를 생성하면서 추가로 4개의 CPU를 요청했기 때문에 발생하는 에러입니다.

안내된 대로 EC2요청 사이트에서 CPU를 추가 신청해 줍시다.

메일로 답변을 받기까지 1-2시간밖에 안 걸려서 인스턴스 실행 완료

0개의 댓글