머신러닝 학습 방법은 학습 형태에 따라 다르다
지도학습 (Supervised Learning)
비지도학습 (Unsupervised Learning)
강화학습 (Reinforcement Learning)
지도학습
1. 분류(Classification)
고객유지, 진단, 이미지분류, 신원사기탐지
비지도학습
1. 군집화(Clustering)
추천시스템, 타겟마케팅, 고객분류
강화학습
Game AI, 기술습득, 학습과제, 로봇네비게이션, 실시간의사결정
지도학습은 정답이 무엇인지 알고 있는 데이터를
컴퓨터에게 학습해 새롭게 들어오는 데이터에 대한 결과를
예측하는 학습 방법이다.
비지도학습은 지도학습과 달리 정답을 알려주지 않고 예측하는 방법으로 라벨링 되어있지 않은 데이터로부터 패턴이나 형태를 찾아 비슷한 데이터들끼리 군집화해 예측하는 방법이다.
비지도 학습은 데이터가 어떻게 구성되어있는지 밝히는데 사용하는
일종의 그룹핑 알고리즘으로 볼 수 있다.
강화학습은 학습할 데이터를 사전에 준비시키지 않아도 되는 방법
Agent, Environment, Action, Reward의 개념으로 이해 가능하다.
학습을 수행할 주체인 Agent와 Agent가 활동할 Environment이 주어지면, Environment에서 에이전트의 Action을 관찰하여 행동에 따른 Reward을 주는 방식으로 Agent의 행동이 더 나은 방향으로 개선되도록 하는 학습 방법이다.
알파고가 강화학습의 대표적인 예
Regression(회귀)
Linear(선형), Ridge(릿지), Lasso(라쏘) 회귀등이 대표적
Classification
kNN(최근접이웃), Naive Bayes(나이브베이즈), SVM(Support Vector Machine)이 대표적이다
Decision Tree(결정트리)
Random forest(랜덤포레스트)
Clustering
k-means(k-평균 알고리즘), PCA(주성분분석), Density Estimation(밀도추정)
Association analysis(상관분석)
예전부터 존재했던 학습법이지만 이전 알고리즘들은
실생활에 적용할 수 있을 만큼 좋은 결과 내지 못했지만
딥러닝 등장 이후 강화학습에 신경망을 적용하며
많은 것들이 등장했다
대표적인 알고리즘으로는 다음이 있다.
DQN , A3C