sort_values()와 sort_index()
df.sort_values(by='sum',ascending=False)['name'].head(3).values.tolist()
sort_values()
어떤 컬럼의 값을 기준으로 데이터를 정렬한다. 괄호에 기준이 되는 컬럼을 by=’~’로 설정
sort_index()
인덱스를 기준으로 정렬(ascending=False로 내림차순 정렬 가능)
가설 검정 방법
1. 귀무가설과 대립가설을 설정한다.
2. 유의수준을 정한다.
3. 표본을 수집해서 검정통계량을 계산하고 그에 따른 p값을 계산한다.
- 검정통계량 : 수집한 데이터를 이용해서 계산한 확률변수
- 확률변수 : 특정 확률로 발생하는 각각의 결과를 수치값으로 표현한 변수.
4. 계산한 p값이 유의수준보다 작으면 귀무가설 기각, p값이 유의수준보다 크면 귀무가설 채택
- 보통 유의수준을 0.05, 0.01로 생각함.
진도를 많이 못 나갔다ㅠㅠ 개인적으로 가설검정 부분이 제일 어려운데 통계 용어도 너무 어렵고 어떤 과정을 거쳐서 검정하는지 머리에 잘 잡히지 않는다 ㅠㅠ 가설검정 부분은 다시 정리해서 공부해야겠다.
참고 : https://drhongdatanote.tistory.com/80