- Span Detection: 스팸 메일인지, 아닌지 구분
- Facebook Feed: 무수히 많은 타임라인 중 이전 사용자의 취향을 적용하여 표시할지 말지
- Credit Card Fraudulent Transaction Detection
1번의 Span Detection에서
0과 1로 인코딩하는 경우가 많다.
스팸 메일 (1) Facebook Feed Show(1)
스팸 아닌 메일 (0) Facebook Feed Hide(0)
Pass(1) or Fail(0) based on study hours.
Linear Regression으로 적용이 될까?
위의 그래프를 살펴보면, 0.5 hours를 기준으로 " Pass 와 Fail "이렇게 단순하게 나눌수 있다.
그러나 위의 그래프에는 한계가 존재한다.
100hours를 공부해도 Y축 좌표의 1에만 머문다는 한계가 존재하기 때문이다.
H(x) = Wx + b의 가설함수일 때, 그래프는 아래와 같다.
그러나 앞의 강의에서 설명한 것 처럼, 범위를 0 ~ 1로 설정하면
가설식이 바뀌기에 cost함수가 바뀌게 된다. 그래프는 아래와 같다.
위의 그래프에는 문제점이 있다.
노란색 별표 지점에서 "아, 여기가 최저점인가?" 싶다가도,
빨간색 별표 지점이 최저점이라는 것을 알 수 있다.
즉, Global Minimum 과 Local Minimum 을 착각할 수 있다.
따라서 gradiant descent 알고리즘에는 위의 함수를 사용할 수 없다.