[9일차] AI 기본 이론

이나겸·2022년 4월 4일
0
post-thumbnail

1. 학습내용

머신러닝

머신러닝은 인간이 개발한 알고리즘을 컴퓨터 언어를 통해 기계에게 학습 시키는 행위이다.
Machine Learning > Machine Learned > By Computer Languages > To perform the algorithm
: Create by Human (사람에 의해 만들어진다)

머신러닝의 종류

  • Supervised Learning (지도 학습)
    (1) Classification (분류)
    (2) Regression (회귀)
  • Unsupervised Learning (비지도 학습)
    (1) Dimensionality Reduction (차원 축소)
    (2) Clustering (클러스터링)
  • Reinforcement Learning (강화 학습)

Classificiation (분류)

분류는 많이 사용되는 알고리즘 중 하나이다.
사이버 대학에서는 자퇴생이 많다.
자퇴생의 루틴을 미리 파악한 다음 그 결과치에 비슷해지는 학생이 나타나면
자퇴하지 않도록 멘토 등과 같은 관리가 이루어지게 할 수 있다.

Regression (회귀)

머신러닝 알고리즘 중 1등.
대부분 회귀 알고리즘으로 해결한다.
신발가게에서 키에 대한 발크기에 대한 데이터를 가지고 있다면,
고객이 들어오는 입구에 초음파 센서를 부착해놓고 들어오는 사람의 키를 측정할 수 있으면
신발 사이즈 별로 바로 추천할 수 있는 서비스를 할 수 있다.

비지도학습

문제안에서 패턴/구조를 발견해서 그룹화한다 : anomaly, clustering
anomaly는 카드사와 비행기 엔진에 대해 이상징후를 감지하는 데 사용될 수 있다.
갑자기 큰 돈을 사용하거나 해외결제가 이루어지는 경우,
비행기에서 이륙했다가 착륙할 때 센서에서 나오는 데이터는 10Tb정도 된다.
평상시 측정되는 센서의 데이터와 달리 튀는 데이터가 있을 때 알려준다.

Orange Data Mining

  • 코딩없이 데이터를 분석할 수 있는 도구
  • 최근 3버전 부터는 python 생태계와 함께 성장하고 있음
  • Regression, Classification, Clustering 등 대부분의 알고리즘을
    Orange Data Mining에서 실행해 볼 수 있음

2. 중요내용

보스턴 주택가격 예측을 통한 지도학습 (회귀)

  1. .csv 파일을 먼저 만들고, orange에서 파일을 불러온다.
    type을 numeric이나 classifical 등 적절하게 선택해준다.
    Role도 target을 선택해준다.
  2. Data Table을 통해 데이터에 대해 확인할 수 있다.
  3. 다양한 모델을 통해 학습에 대한 오차율과 적중률을 구할 수 있다.
  4. Evaluate의 ROC Analysis를 통해 그래프로 확인 가능하다.

MAE (Mean Absolute Error)
동일한 현상을 표현하는 동등 관측치 간의 오차 측정값.
전체 에러 합계의 평균값이라고 생각하면 된다. 측정치가 작으면 작을 수록 좋다.
이 값이 작게 나올 수 있도록 고민해야 한다.

MSE (Mean Squre Error)
에러 총합의 곱, 오류를 볼 때 큰 에러들이 있으면 오류가 잘 보인다.
어떤 경우에는 오류가 도드라지지 않는데 정확도를 높이려면 에러를 도드라지게 만들어야한다.
제곱하면 에러가 커져서 조금 더 도드라지는 현상이 발생한다.


3. 학습소감

orange로 진행한 머신러닝 첫 시간인데,
프로그래밍이 없지만 처음 다뤄보는 프로그램이라 생소했다.

0개의 댓글