TIL 201106

·2020년 11월 5일
0

TIL

목록 보기
4/5

TODAY I LEARNED ✨

칸아카데미 - 통계학

  • 양적자료
  • 자료분포
  • 이변량 수적자료
  • 확률
  • 계산, 순열, 조합
  • 확률 변수
  • 표본분포

자료 분포 모델링

  • 정규분포


  • Z SCORE


    정규분포의 해당 면적에 대한 Z-SCORE를 구한다.
    X = 평균값 - (Z * 표준편차)



  • 정규분포의 표준편차 경험적인 규칙( 50 -68 -95 -99.7%)


    1시그마 : 68%
    2시그마 : 95%
    3시그마 : 99.7%

  • 정규분포 정의 심화

    정규분포에서 특정 값이 나올 확률을 알 수 없다.
    특정 범위값이 나올 확률만 구할 수 있다.
    넓이로 값을 구하기 때문이다. (특정값이란 밑변이 0에 가깝게 된다)
    곡선아래 두 점사이의 면적을 구해야한다.
    자연현상으로 자료가 무한대일수록, 정규분포에 가까워진다.

🤍 REFERENCE
Z-TABLE

이변량 수적 자료

  • 상관계수 r

    -1 < r < 1
    -1 음의 상관관계
    0 관계 없음
    1 양의 상관관계

  • 잔차도

    선형모델과 실제 값의 차이를 나타낸 잔차도에서
    추세가 없다면, 선형모델이 산점도를 잘 설명하고,
    추세가 있다면, 선형모델보다 비선형모델을 사용하는 것이 좋다는 의미이다
    예측값이 실제 값보다 작을 경우, 잔차는 양수 ( 잔차 = 실제값 - 예측값 )
    y =0 선분을 기준으로, 위의 점의 개수가 많으면(즉 양수이면,) 모델이 과소평가하고 있다는 의미.

  • 잔차들의 합

    자료가 선형모델에 맞는지 계산하는 방법 중 하나
    전체적인 예측 오차 값을 알 수 있다.

  • 결정계수 r^2

    변수 x 에 대한 회귀분석을 통해, 변수 y의 변동 비율을 알려준다.

  • 잔차의 표준편차 s

    각 잔차의 제곱들의 합 / (n -1)

    이 값이 적을 수록 선형모델이 잘 나타낸다고 본다.
    잔차의 표준편차(s)는 변수 y에 대해서 예측 오차의 크기를 나타낸다.
    따라서 s의 단위는 y의 단위와 일치한다.

  • 주의 강력한 상관관계가 인과관계를 내포할 필요가 없다.

  • 이상치를 빼는 것이 회귀직선에 주는 영향

    이상치 제거시, r의 값을 키우고, 기울기를 크게 할 것이다.

❕ r이 음수일때, r^2은 더 작아지지 않고, 커진다! (음->양 변화)

확률

독립적 사건

첫번째 확률이 두번째 확률에 영향을 끼치지 않는다는 것
각각의 확률의 곱으로 계싼

  • 자유투 확률


    자유투 확률이 75% 일때 n번 던져서 n번 연속으로 성공학 확률 (75%)^n 이다.
    그림을 통해 직관적으로 이해했다.

  • 시험치기 확률

    보기의 개수가 다른 두 문제에 정답을 맞출 확률

    1/각 보기의 개수 * 1/각 보기의 개수
    표를 통해 직관적으로 이해했다👨🧔

  • 적어도 하나는

profile
XOXO architecture

0개의 댓글