오늘부터 lms에 통계 개념이 나오기 시작해서 퍼실님이 또 명강의를 해주셨다 🙌
고등학생 때 이후로 통계를 처음 접하니 정말 낯설다..
굳어버린 머리에 웃음이 나지만 부족한 만큼 열심히 해야지..╰(°▽°)╯
표본 공간
: 어떤 특정 실험 또는 무작위 실험을 했을 때, 측정가능한 모든 결과들의 집합
사건
: 개별적인 실험의 결과
시행
: 동일한 조건 아래에서 여러 번 반복 가능하고, 그 결과가 우연적으로 결정되는 실험 또는 관찰
랜덤변수
: 확률에 따라 변하는 값.
표본공간의 원소들을 실수공간으로 사상(mapping)하는 함수.
분산
: 데이터의 값들이 평균으로부터 멀어진 정도
import random
# 주사위 던지기를 시행
throwing_number = 100
# 주사위 던지기 시행의 결과를 random_dice라는 리스트에 저장
random_dice = [random.randint(1, 6) for i in range(throwing_number)]
# 주사위 던지기 사건에 대한 랜덤 변수 생성
random_var_dict = {i:0 for i in range(1, 7)}
random_var_dict
# 주사위의 랜덤변수에 대한 확률 생성
for key in random_var_dict:
random_var_dict[key] = random_dice.count(key) / throwing_number
print(random_var_dict)
# 데이터 시각화
import matplotlib.pyplot as plt
x = random_var_dict.keys()
p = random_var_dict.values()
plt.plot(x, p)
plt.legend()
plt.show()
# Hint : 기존의 random_var 딕셔너리 사용
# 주사위 랜덤변수에 대한 기댓값을 계산합니다.
exp = 0
for keys, values in random_var_dict.items():
exp += keys * values
# 분산 구하기
var = 0
# 힌트: 계산한 expectation 값을 활용해야한다.
for keys, values in random_var_dict.items():
var += (keys - exp)**2 * values