FUNDAMENTAL | 07-3. 통계 기초

yeonk·2021년 9월 15일
1

aiffel-ai-bootcamp

목록 보기
18/38
post-thumbnail

210915

오늘부터 lms에 통계 개념이 나오기 시작해서 퍼실님이 또 명강의를 해주셨다 🙌
고등학생 때 이후로 통계를 처음 접하니 정말 낯설다..
굳어버린 머리에 웃음이 나지만 부족한 만큼 열심히 해야지..╰(°▽°)╯



표본공간과 사건

표본 공간: 어떤 특정 실험 또는 무작위 실험을 했을 때, 측정가능한 모든 결과들의 집합

사건: 개별적인 실험의 결과

시행: 동일한 조건 아래에서 여러 번 반복 가능하고, 그 결과가 우연적으로 결정되는 실험 또는 관찰

랜덤변수: 확률에 따라 변하는 값.
표본공간의 원소들을 실수공간으로 사상(mapping)하는 함수.

분산: 데이터의 값들이 평균으로부터 멀어진 정도






Random Variable, Probability

import random

# 주사위 던지기를 시행
throwing_number = 100

# 주사위 던지기 시행의 결과를 random_dice라는 리스트에 저장
random_dice = [random.randint(1, 6) for i in range(throwing_number)]

# 주사위 던지기 사건에 대한 랜덤 변수 생성
random_var_dict = {i:0 for i in range(1, 7)}
random_var_dict






랜덤변수에 대한 확률 할당하기

# 주사위의 랜덤변수에 대한 확률 생성
for key in random_var_dict:
    random_var_dict[key] = random_dice.count(key) / throwing_number

print(random_var_dict)






# 데이터 시각화
import matplotlib.pyplot as plt

x = random_var_dict.keys()
p = random_var_dict.values()
plt.plot(x, p)
plt.legend()
plt.show()






기댓값 (Expectation, 평균)

# Hint : 기존의 random_var 딕셔너리 사용
# 주사위 랜덤변수에 대한 기댓값을 계산합니다.

exp = 0
for keys, values in random_var_dict.items():
    exp += keys * values






분산(Variance)

# 분산 구하기
var = 0
# 힌트: 계산한 expectation 값을 활용해야한다.

for keys, values in random_var_dict.items():
    var += (keys - exp)**2 * values

0개의 댓글