[ML] 수치예측, 범주예측

박건·2023년 8월 23일
0

[ML] Machine Learning

목록 보기
3/10

0. 들어가며


Machine Learning 은 주어진 X와 Y데이터를 이용하여 모델 F(x)를 추론하는 과정이라고 배웠다.

그렇게 모델 F(x)를 추론하고 나면 새로운 데이터 X가 주어졌을 때, 모델에 입력 X를 넣어서 출력 Y값을 예측 할 수 있다.

결국 Machine Learning 은 특정 값을 예측하기 위한 수단으로 사용할 수 있다는 뜻이다.

1. 수치예측 / 범주예측


예측해야 하는 Y값이 연속형인지, 범주형인지에 따라 수치예측 혹은 범주예측으로 나누어진다.

연속형 데이터와 범주형 데이터의 예시는 다음과 같다.

  • 연속형 데이터 : 숫자로 표현되는 데이터
    ex) 가격, 길이, 압력, 두께 등
  • 범주형 데이터 : 숫자로 표현할 수 없는 데이터(분류 데이터)
    ex) 제품불량여부(양품/불량), 보험사기여부(정상/비정상), 합격여부(합/불합)등

2. 수치예측


수치예측 데이터 는 다음과 같이 Y값들이 연속된 숫자로 표현되는 데이터이다.

위는 수치예측 방법의 예이다.

다음은 이전 포스팅에서 보았던 중고차 데이터 예제인데 X와 Y가 다음과 같이 주어졌을 때 모델 F(x)를 구축 할 수 있고, 새로운 데이터(빨간색 글씨)가 들어온다면 구축한 모델 F(x)를 이용하여 Y값을 예측할 수 있다.

3. 범주예측


범주예측 데이터 는 다음과 같이 Y값들이 특정 레이블로 분류가 되는 데이터이다.

위는 범주예측 방법의 예이다.

다음은 디스플레이 공정 데이터를 이용하여 모델을 구축하고, 해당 글라스가 양품인지 불량품인지를 예측하는 예시이다.

비슷한 예로 다음은 고객의 데이터를 이용하여 모델을 구축하고, 고객이 계속 유지할지 이탈할지를 예측하는 예시이다.

4. 마치며


오늘은 예측해야 할 데이터 Y의 종류에 따라 해당 학습이 수치예측 인지 범주예측 인지를 구분할 수 있게 되었다.

다음 포스팅은 머신러닝 모델 이 어떤 방식으로 학습하고 만들어지는지에 대하여 기술할 예정이다.

또한 필자는 고려대학교 김성범 교수님이 운영하시는 유튜브 채널을 보고 공부한 내용을 포스팅 하였으므로 아래 출처를 남긴다.
https://www.youtube.com/@user-yu5qs4ct2b

profile
예비대학원생

0개의 댓글