머신러닝(ML) 정리

이주현·2023년 12월 10일
0

머신러닝

목록 보기
4/14

머신러닝 이란?

Cost 최소화를 찾는것!!! = min cost weight

머신 러닝은 데이터를 기반으로 학습하고 경험을 통해 스
스로 개선하는 능력을 갖추게 하는 인공 지능의 하위 분야이다.
머신 러닝은 데이터와 통계적 알고리즘을 사용하여
컴퓨터 시스템을 훈련시켜 다양한 작업을 수행하고 패턴을 인식한다.

머신러닝의 분류

  • 지도 학습

    • 문제와 정답이 있으면 지도학습이라 한다.
    • 정답 = target data
  • 비지도 학습

    • 문제(Input)만 있다.
  • 강화 학습

    • 배우지 않아서 Pass..

지도 학습과 비지도의 근본적인 차이점 = 목적

  • 출력값(라벨, 타겟)의 유무는 학습시키는 목적에 의해 결정된다.

  • 지도 학습은 객관식 시험같은 것이며
    내가 생각하는 것처럼 너도 똑같이 배워라는 것가 같다

  • 비지도 학습은 "네가 어떻게 생각하는지 너의 의견을 나한테 알려줘"와 같다

지도 학습의 방법

  • 회귀(Regression)

    • 입력 데이터와 연속적인 출력 값 사이의 관계를 모델링 하는 작업
      ex) 주택 가격 예측, 수익 예측 등
  • 분류(Classification)

    • 입력 데이터를 여러 클래스 중 하나로 분류하는 작업
      ex) 스팸 메일 필터링, 의료 진단, 이미지 분류 등

비지도 학습의 방법

  • 군집화 (Clustering)
    • 데이터를 유사한 그룹 또는 군집으로 묶는 작업
    • 데이터 간의 유사성을 기반으로 패턴을 찾는다
      ex) K-평균 군집화, 계층적 군집화 등
  • 변환 (Transformation)


머신러닝의 워크 플로우

0단계 : Hypothesis 를 설정(선형관계다! => 내가 정함)

1단계 : Weights 초기값 설정
(최적의 weights를 한번에 찾을 순 없으니 아무데서나 시작(fitting)

2단계 : Cost확인 => 내가 바라는 결과와 얼마나 틀렸나?

3단계 : 경사하강법(Gradient Descent) G가 0이 될때까지 3단계를 계속 반복

2 3단계를 무한반복 기울기가 0이될때까지!

ML 사용할 때 고민해야 할 것

사람이 할일 ->

    1. 모델선정
    1. Cost Function
    1. 하이퍼 파라미터(영향을 주는 옵션들)

모델의 복잡도

복잡한 모델

장점

  • 복잡한 데이터를 잘 설명

단점

  • 과하게 학습이 됨 -> over fitting, parameter 수가 늘어남
  • 파라미터가 늘어남으로써 연산량도 올라가게됨

over fitting = 학습은 잘하는대 상대적으로 테스트할때 성능이 떨어짐

단순한 모델

장점

  • over fitting 확률이 적음
  • 학습도 비교적 빠름

단점

  • 복잡한 데이터를 잘 설명 못한다.
  • under fitting 발생 할 수 있다 = 학습자체도 제대로 안된것

profile
Backend Delveloper

0개의 댓글