logistic 데이터들은 discrete 하고 셀 수 있지만 linear 데이터는 continuous 하고 셀 수 없다.
Linear regression function으로는 데이터는 0 또는 1로 구분할 수 없다.
하지만, logistic function으로는 데이터를 discreate하게 구분할 수 있게 된다.
cost function 부분(10강 8:21)이 잘 이해가 되지 않음
cost function은 앞에서 살펴본 바와 같이 오목한(=convex)한 형태를 띠고 있다.
따라서 cost 의 값이 가장 작아지는 부분은 cost function의 경사(=gradient)가 가장 작게 된느 부분이다.
learning rate alpha 값과 gradient값, alpha값을 모두 곱하는 것을 계속해서 반복하다보면 이 최소화된 gradient값에 도달하게 된다.