tensor
gradient exploding/vanishing 이 왜 RNN에서는 일어나는지 어떻게 해결할 수 있는지 알아두면 좋을 것 같습니다. 1. 모델 아키텍쳐로 해결 2. 학습 trick으로 해결
gradient exploding/vanishing 이 왜 RNN에서는 일어나는지 어떻게 해결할 수 있는지 알아두면 좋을 것 같습니다.
1. 모델 아키텍쳐로 해결
2. 학습 trick으로 해결