머신러닝
직역을 하면 기계학습이다.

기계학습을 하기위해서 데이터가 필요한데 데이터 중에서도 크게 정형 데이터와 비정형 데이터로 구분한다.
정형 데이터
- 양적 데이터
- 사전에 정의됨.
- 모델이 정의되고 일부 데이터가 저장된 후에는 모델을 변경하기 어렵습니다.
데이터의 특징들을 살려서 그 특징들을 학습시켜 분류를 한다.
비정형 데이터
- 질적 데이터
- 데이터 모델은 매우 유연하다.
- 매우 다양한 데이터 포맷을 사용할 수 있다.
학습방법
지도학습, 비지도학습, 강화학습
지도 학습
정답이 있는 데이터를 활용해 데이터를 학습시키는 것을 말한다.
입력 값(X data)이 주어지면 입력값에 대한 Label(Y data)를 주어 학습시키며 대표적으로 분류, 회귀 문제가 있습니다.
회귀
- 입력 변수와 연속적인 출력 변수 간의 관계를 모델링 하는 방법이다.
- 다양한 알고리즘과 기법을 사용하여 구현
분류
- 이미 정해진 카테고리 안에서 학습
- 데이터의 범주를 구분한다.
비지도 학습
- 비슷한 데이터들을 군집화 하는것
- 그룹핑 알고리즘