범주형 변수의 빈도수

매일 공부(ML)·2022년 2월 13일
0

학습 목표

범주형 변수의 기술통계에 대해 알아봅니다.


핵심 키워드

빈도수(count)

유일값(unique)

결측치(isnull, isna)

최빈값(top), 최빈값의 빈도수(freq)

describe(include="object")


데이터 및 라이브러리 로드

*라이브러리 로드

# 데이터 분석을 위한 pandas 라이브러리를 불러옵니다.
# 수치계산을 위한 numpy를 불러옵니다.
# 데이터 시각화를 위한 matplotlib, seaborn 을 불러옵니다.

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

*버전확인

print(pd.__version__) #1.3.5
print(sns.__version__) #0.11.2

*데이터셋 불러오기

# mpg 데이터셋을 불러옵니다.
# df
df = sns.load_dataset("mpg")
df.shape#(398,9)

*데이터셋 일부만 가져오기

# head
df.head()

# tail
df.tail()

*요약

df.info()

*결측치 보기

df.isnull().sum()


범주형 변수의 기술통계

# describe 를 통해 범주형 변수에 대한 기술통계를 보기
df.describe()

  • 빈도수(count)

  • 유일값(unique)

  • 결측치(isnull, isna)

  • 최빈값(top), 최빈값의 빈도수(freq)

  • describe(include="object)

df.describe(include="object")

profile
성장을 도울 아카이빙 블로그

0개의 댓글