AI - 머신러닝

_찬·2022년 9월 3일
0

머신러닝

목록 보기
1/2
post-thumbnail

머신러닝은 총 3가지로 나뉜다.

  1. 지도학습 (Supervised Learning)
  2. 비지도학습 (Unsupervised Learning)
  3. 강화학습 (Reinforcement Learning)

1. 지도학습

먼저 지도학습이란 정답이 있는 데이터를 활용해서 모델을 학습시키는 것이다.

  • 지도 학습의 종류
  1. 분류 (Classification)
  2. 회귀 (Regression)

1 - 1 분류 (Classification)

분류는 주어진 데이터를 사용해 정해진 카테고리(라벨)에 따라 분류하는 문제이다.
분류도 2가지로 나뉜다.

  1. 이진 분류
  2. 다중 분류

이진 분류는 자동차인지 사람인지 구별하는 문제이다.
다중 분류는 자동차인지 사람인지 오토바이인지 2개 이상을 분류하는 문제이다.

예를 들어서 받는 메일이 스펨인지 아닌지를 확인 할 수 있다
Kaggle 스펨메일 분류 예제


1 - 2 회귀 (Regression)

회귀는 어떤 데이터들의 Feature를 기준으로 연속된 값(그래프)을 예측하는 문제이다.
주로 요즘 트렌드, 집 시세와 같은 것을 예측할 때 사용된다.
예측값은 1과 0이 아닌 실수형태로 예측이 된다.

회귀도 Kaggle에서 제공하는 보스턴 주택 가격 예측 예제가 있다.
Kaggle 보스턴 주택 가격 예측 예제

Feature

머신러닝에서 어떤 데이터를 분류하거나, 값을 예측하는 것이다.
값을 잘 예측하기 위한 데이터의 특징을 머신러닝/딥러닝에서는 "Feature" 이라고 부르며 이 Feature는 다음 내용에서 더 자세하게 정리해보도록 하겠다.

2. 비지도학습

지도학습과는 달리 정답 라벨이 없는 데이터를 비슷한 특징끼리 군집화하여 새로운 데이터에 대한 결과를 예측하는 방법을 비지도학습이라고 한다.
비지도학습은 지도학습보다는 난이도가 조금 있는 편이지만 지도학습에서 적절한 피처를 찾아내기 위한 전처리 방법으로도 많이 사용한다.


지도학습과 비지도학습의 대표적인 알고리즘


출처 : https://wendys.tistory.com/169


3. 강화학습

강화학습은 행동 심리학에서 나온이론으로 분류할 수 있는 데이터가 따로 존재하지 않으며 자신의 행동에 보상을 얻으며 학습하는 것이다.

강화학습의 개념

에이전트(Agent)
환경(Environment)
상태(State)
행동(Action)
보상(Reward)


예시로는 강아지(Agent)가 앉는 행동(Action)을 하였을때 간식(Reward)을 주는 것



참고한 사이트

https://kr.mathworks.com/discovery/reinforcement-learning.html
https://ebbnflow.tistory.com/165

profile
꾸준한 사람이 되길!

0개의 댓글