Chapter 1
sigmoid는 어디에서나 미분이 가능하다. -34
w1x1+w2x2+b 는 [w1,w2,b]⋅[x1,x2,1] 로 표현될 수 있다. 컴퓨터에서는 내적계산이 용이하므로 이러한 특성을 잘 활용하면 좋다. -36
픽셀마다 중요도가 다르므로( 특정 결과를 유도하기 위해서는 특정 픽셀이 반드시 필요하다고 생각할 수 있다.) 가중치 Wi,j는 픽셀마다 다 다르다. -52
모델의 W 와 b의 초깃값을 표준분포로 초기화하면 좋은 결과를 얻는다고 알려져있음!
백터의 내적
백터의 내적이란 스칼라(크기)만 고려해서 계산한 것. - 78
a⋅b=∣a∣⋅∣b∣cosθ
a=(a1,a2,a3),b=(b1,b2,b3)
∣a∣⋅∣b∣=(a1⋅b1)+(a2⋅b2)+(a3⋅b3)
신경망을 위한 미분의 기본
Sigmoid function
기존 기본적인 activation function중에 하나이다.
모든 구간에서 미분 가능!!
σ(x)=1−e−x1
분수의 미분식 (f(x)1)′=f(x)2f′(x) 에 따라 σ′(x)=σ(x)(1−σ(x)) 로 정리된다.