이제 9주차 부터 진행할 프로젝트를 위한 Python 라이브러리인 Matplotlib과 pandas를 배워보았다.
이들은 주로 데이터 분석과 시각화를 위한 라이브러리로 쓰인다.
Object-oriented
1번 + 2번
RNN은 여러 개의 cell 로 이루어져 있다.
이전의 값을 기억하여 다음 값에 영향을 준다!
RNN의 종류
sequential하지 않은 data(image)를 input으로 받고 sequential한 output(text)을 출력
문장을 끝까지 읽은 시점부터 번역된 문장을 출력
(아까와 달리 영상을 다 본 시점까지 가지 않고) 과거 부터 현재까지의 image를 통해 output값을 출력
RNN의 용어 정리
sample : sample의 개수 ( 1회 train 기준 = batch_size )
time_step = input_length : 어느 정도의 시간을 고려할 것인가
input_dim : input data의 feature 수
cell 연산
...
특이값에 더 가중치를 둔다.
MAE보다 더 보편적으로 사용한다.
mse에 np.sqrt를 붙이는 방식으로 구현
Classification ( precision, recall )
ex)
ex) 암 판정 중 실제 암일 확률
대략 : 40%
ex) 암 환자 중 암을 진단받을 확률
대략 : 22%
: 잘못된 metric -> 오류 파악하지 못함
해결 : case 맞는 metric 설정
data balance check
Yes : Accuracy 사용
No : F1_score 사용