SSH로 EC2 접속, EC2에서 딥러닝 시작하기

yun·2023년 12월 1일
1

AWS

목록 보기
2/3

할 때마다 새로워서 정리해 두기로 함

인스턴스 실행에 성공했나요? 근데 접속이 안 되나요?

  1. Security Group 체크
  • 내 IP를 Inbound Rule에 추가해주기
  1. 인스턴스 체크 후 Actions > Connect에서 접속에 필요한 정보 재확인

deep learning ami를 선택해서 생성한 인스턴스라면 nvidia-smi로 바로 현재 GPU 상태를 확인할 수 있다!


파이썬과 일부 라이브러리도 설치되어 있다!

그래서 이제 다 잘될 줄 알았더니...

이 에러는

쿠다 버전이 안 맞아서 나는 에러 ^^

또는 batch size를 낮춰보라는 말도 있는데

batch는 16이고 T4 GPU가 yolov5n도 못 버틸 리는 없다..

혹시나 해서 torch와 torchvision 라이브러리를 uninstall 했다가 12.1 index를 넣어서 재설치하니까

pip install torch torchvision --index-url https://download.pytorch.org/whl/cu121

이젠 잘된다!

근데 이렇게 하고 터미널 종료하면 프로세스가 종료돼 있는데요...

train.py 실행할 때 nohup을 붙여보자.
(데이터: 커스텀 / 베이스모델: yolov5n / 에폭: 300회 / optimizer: Adam)

nohup python train.py --data mydata.yaml --cfg yolov5n.yaml --epochs 300 --weights '' --optimizer Adam &

명령어 앞에는 nohup: hang up 하지 않음
뒤에는 &: 백그라운드 실행

그러면 터미널을 껐다 켜도 프로세스는 잘 실행되고 있다.

실행중인 nohup 프로세스의 output 보는 법

tail -f nohup.out

nohup.out 파일은 실행한 경로에 생성된다.

이제 딥러닝 중에도 소음 없이 잘 수 있다!



  • 이 스크린샷 찍으면서 알게 된 terminator preferences

    • 1) 터미널을 여러 개 열었을 때 자꾸 키가 여러번 반복해서 입력되는 이슈 해결
      -> Broadcast를 None으로 변경해 준다. (같은 명령어를 다른 창에도 자동으로 입력하고 싶을 때 Broadcast All로 설정해 주면 된다.)

    • 2) 터미널을 벗어나면 화면이 흐리게 변하는 현상: 이것 때문에 스크린 캡처가 매번 힘들었음 ㅠㅠ
      -> Unfocused terminal brightness의 default값이 20%. 이걸 100%로 해 주면 터미널 입력 중이 아닐 때도 터미널 화면이 평소처럼 보인다.

0개의 댓글