명시적으로 프로그래밍하지 않고도 컴퓨터에 학습할 수 있는 능력을 부여하는 학문 - Arthur Samuel
ex) 알파고
- Decision Tree : 분할 기준(split criterion)
정보 획득 : 발생 확률 작을수록 정보 가치 커짐
정보 이득 : 어떤 속성을 선택함으로서 데이터 잘 구분하게 되는 것
엔트로피 : 얼마만큼의 정보 담고 있는 지, 무질서도/ 불확실성
- 엔트로피가 내려가면 분할하는 것이 좋음
지니 계수 : 불순도율
sklearn
: 기계 학습 오픈 소스 라이브러리
과적합