10/11 오늘의 시간표
09:00 ~ 10:00 [원격] 실전 머신러닝 적용
10:00 ~ 11:00 [원격] 실전 머신러닝 적용
11:00 ~ 12:00 [원격] 실전 머신러닝 적용
12:00 ~ 13:00 [원격] 실전 머신러닝 적용
13:00 ~ 14:00 점심식사
14:00 ~ 15:00 [원격] 실전 머신러닝 적용
15:00 ~ 16:00 [원격] 실전 머신러닝 적용
16:00 ~ 17:00 [원격] 실전 머신러닝 적용
17:00 ~ 18:00 [원격] 실전 머신러닝 적용
18:00 ~ 19:00 저녁식사
19:00 ~ 20:00 [원격] 실전 머신러닝 적용
20:00 ~ 21:00 [원격] 실전 머신러닝 적용
머신러닝 적용 원격 강의
- 2주차
- 논리회귀란?
- 머신러닝에서, 입력값과 범주 사이의 관계를 구하는 것
- 시그모이드 함수
- 실제 많은 자연, 사회현상에서는 특정 변수에 대한 확률값이 선형이 아닌 S 커브 형태를 따르는 경우가 많은데 이러한 S-커브를 함수로 표현해낸 것이 바로 로지스틱 함수(Logistic function)이다. 딥러닝에서는 시그모이드 함수(Sigmoid function)라고 불린다.
- 시그모이드 함수의 특징 :
x(입력)가 음수 방향으로 갈 수록 y(출력)가 0에 가까워지고,
x(입력)가 양수 방향으로 갈 수록 y(출력)가 1에 가까워진다
즉, 시그모이드 함수를 통과하면 0 에서 1 사이 값이 나온다
- Keras에서 이진 논리 회귀의 경우 binary_crossentropy 손실 함수를 사용한다.
- 다항 논리 회귀
- 논리회귀 중 클래스를 3개 이상으로 나눈 것
- 원핫 인코딩(one-hot-encording) : 문제를 풀 때 출력값의 형태를 가장 예쁘게 표현할 수 있는 방법
- 원핫 인코딩을 만드는 방법
1. 클래스(라벨)의 개수만큼 배열을 0으로 채운다.
2. 각 클래스의 인덱스 위치를 정한다.
3. 각 클래스에 해당하는 인덱스에 1을 넣는다.
- Keras에서 다항 논리 회귀의 경우 categorical_crossentropy 손실 함수를 사용한다.
- 전처리
- 전처리란?
전처리는 넓은 범위의 데이터 정제 작업을 뜻한다. 필요없는 데이터를 지우고 필요한 데이터만을 취하는 것, null 값이 있는 행을 삭제하는 것, 정규화(Normalization), 표준화(Standardization) 등의 많은 작업들을 포함하고 있다.
- 정규화 : 데이터를 0과 1사이의 범위를 가지도록 만드는 것
- 표준화 : 데이터의 분포를 정규분포로 바꿔두는 것
이후로는 colab과 kaggle을 이용한 실습이 대부분이었다.
오늘 하루를 마치며
3일간의 휴식을 마치고 다시 원격강의를 듣는데 여전히 머신러닝은 어렵고 내용은 이해가 잘 안된다. 아무래도 한번 강의를 다 듣고나서 복습의 시간을 아주 많이 가져야 할 것 같은 예감이 든다.