Q1 ~ Q4 사분위수 값 구하기
4분위수는 전체의 퍼센트를 100퍼센트라고 했을경우
아래의 표처럼 4개의 균등한 부분으로 분할한것을 말한다.
Q | Percent(%) | Value |
---|---|---|
1 | 25 | 0.25 |
2 | 50 | 0.5 |
3 | 75 | 0.75 |
4 | 100 | 1 |
👀 Pandas의 DataFrame에서 사분위수를 구하는 방법을 알아보자!
여기에서는 코로나 데이터를 기준으로 구해본다.
# 데이터 로드
covid = pd.read_csv('../notebook/Latest Covid-19 Data in Asia.csv')
# 그래프 확인
covid.plot(kind='scatter',x='Population',y='Total Cases')
#사분위수 구하기
q1 = covid['Population'].quantile(0.25)
q2 = covid['Population'].quantile(0.5)
q3 = covid['Population'].quantile(0.75)
q4 = covid['Population'].quantile(1)
# IQR값 구하기
iqr = q3-q1
#이상치값 구하기
condition = covid['Population'] > q3+1.5 * iqr
covid[condition]