가설검정1, sort_values와 sort_index

꼬부썬·2022년 10월 21일
0

sort_values()와 sort_index()

df.sort_values(by='sum',ascending=False)['name'].head(3).values.tolist()

sort_values()

어떤 컬럼의 값을 기준으로 데이터를 정렬한다. 괄호에 기준이 되는 컬럼을 by=’~’로 설정

sort_index()

인덱스를 기준으로 정렬(ascending=False로 내림차순 정렬 가능)


가설 검정 방법

1. 귀무가설과 대립가설을 설정한다.

2. 유의수준을 정한다.

3. 표본을 수집해서 검정통계량을 계산하고 그에 따른 p값을 계산한다.

  • 검정통계량 : 수집한 데이터를 이용해서 계산한 확률변수
    • 확률변수 : 특정 확률로 발생하는 각각의 결과를 수치값으로 표현한 변수.

4. 계산한 p값이 유의수준보다 작으면 귀무가설 기각, p값이 유의수준보다 크면 귀무가설 채택

  • 보통 유의수준을 0.05, 0.01로 생각함.

진도를 많이 못 나갔다ㅠㅠ 개인적으로 가설검정 부분이 제일 어려운데 통계 용어도 너무 어렵고 어떤 과정을 거쳐서 검정하는지 머리에 잘 잡히지 않는다 ㅠㅠ 가설검정 부분은 다시 정리해서 공부해야겠다.

참고 : https://drhongdatanote.tistory.com/80

0개의 댓글