활성화 함수의 종류

ai_lim·2022년 1월 21일

AI

목록 보기

7/16

딥러닝에서 활성화 함수는 왜 필수적일까?

활성화 함수는 보통 비선형 함수를 사용하는데 MLP안에 포함시키면서 모델의 표현력이 좋아지기때문이다. 레이어 사이에 비선형 함수가 포함되지않은 MLP는 그저 한개의 레이어로 이루어진 모델과 다를게 없다.

그림에서도 볼 수 있듯이 시그모이드함수를 쓰면 어떤 출력값이든 0~1 사이로 맞출 수 있다.
하지만 활성화함수로 쓰기에는

vanishing gradient 현상이 발생한다.

함수의 출력값이 0과 1에 가까워지면(주황색부분) 기울기가 0에 가까운 작은 값이 나오게 되는데 역전파 과정에서 이 작은 기울기가 곱해지면 앞단에 기울기가 잘 전달되지않게 된다. 은닉층의 개수가 많을때 0에 가까운 기울기가 계속 곱해지면 학습이 되지 않는다.