[제로베이스 데이터 취업스쿨] 23.08.03 스터디 노트

김준호·2023년 8월 7일
0

1. 모집단과 표본

  • 표본 추출
    모집단으로 부터 표본을 추출 하는 것을 Sampling이라고한다.
    표본으로 부터 그 특성을 찾아내고 모집단의 특성을 추론하고자 함

  • 모집단 sampling 방법
    1) 복원추출
    모집단에서 데이터를 추출 할 때 하나를 추출하고 다시 넣어 추출하는 방법
    동일한 표본이 추출 될 수 있다.
    2) 비복원 추출
    모집단에서 데이터를 추출 할 때 하나를 추출 하고 다시 넣지 않고 추출하는 방법
    3)Random sampling
    모집단에서 데이터를 추출 할 때 주의할 점은 편향되지 않아야 한다.
    각 개체 모두 동일한 확률로 추출하는 방법

1) 불균형 데이터의 문제

  • 우리가 예측모형을 만드는 목적은 관심이 있는 대상이 발생 할 확률을 예측하는 경우가 대부분
  • 예측 대상이 전체 대비 너무 적다면 불균형 데이터 이다.

이를 해결하기 위해 몇가지 방법이 있다.
1. sampling 기법을 통하여 해결
2. 모델을 통한 성능개선

1-1. sampling 기법

2. 표본분포

2-1) ⭐중심극한 정리⭐

  • 예제

2-2) 카이제곱분포

  • 자유도

예제

  • 카이제곱 분포 표

2-3) ⭐⭐T분포⭐⭐

예제

2-4) F분포

예제

profile
취업공부

0개의 댓글