TODAY I LEARNED ✨
칸아카데미 - 통계학
정규분포의 해당 면적에 대한 Z-SCORE를 구한다.
X = 평균값 - (Z * 표준편차)
1시그마 : 68%
2시그마 : 95%
3시그마 : 99.7%
정규분포에서 특정 값이 나올 확률을 알 수 없다.
특정 범위값이 나올 확률만 구할 수 있다.
넓이로 값을 구하기 때문이다. (특정값이란 밑변이 0에 가깝게 된다)
곡선아래 두 점사이의 면적을 구해야한다.
자연현상으로 자료가 무한대일수록, 정규분포에 가까워진다.
🤍 REFERENCE
Z-TABLE
상관계수 r
-1 < r < 1
-1 음의 상관관계
0 관계 없음
1 양의 상관관계
잔차도
선형모델과 실제 값의 차이를 나타낸 잔차도에서
추세가 없다면, 선형모델이 산점도를 잘 설명하고,
추세가 있다면, 선형모델보다 비선형모델을 사용하는 것이 좋다는 의미이다
예측값이 실제 값보다 작을 경우, 잔차는 양수 ( 잔차 = 실제값 - 예측값 )
y =0 선분을 기준으로, 위의 점의 개수가 많으면(즉 양수이면,) 모델이 과소평가하고 있다는 의미.
잔차들의 합
자료가 선형모델에 맞는지 계산하는 방법 중 하나
전체적인 예측 오차 값을 알 수 있다.
결정계수 r^2
변수 x 에 대한 회귀분석을 통해, 변수 y의 변동 비율을 알려준다.
잔차의 표준편차 s
각 잔차의 제곱들의 합 / (n -1)
이 값이 적을 수록 선형모델이 잘 나타낸다고 본다.
잔차의 표준편차(s)는 변수 y에 대해서 예측 오차의 크기를 나타낸다.
따라서 s의 단위는 y의 단위와 일치한다.
주의 강력한 상관관계가 인과관계를 내포할 필요가 없다.
이상치를 빼는 것이 회귀직선에 주는 영향
이상치 제거시, r의 값을 키우고, 기울기를 크게 할 것이다.
❕ r이 음수일때, r^2은 더 작아지지 않고, 커진다! (음->양 변화)
독립적 사건
첫번째 확률이 두번째 확률에 영향을 끼치지 않는다는 것
각각의 확률의 곱으로 계싼
자유투 확률
자유투 확률이 75% 일때 n번 던져서 n번 연속으로 성공학 확률 (75%)^n 이다.
그림을 통해 직관적으로 이해했다.
시험치기 확률
보기의 개수가 다른 두 문제에 정답을 맞출 확률
1/각 보기의 개수 * 1/각 보기의 개수
표를 통해 직관적으로 이해했다👨🧔
적어도 하나는