수치형, 범주형 마다의 어떤 그래프를 써야 적절한지 알아보기.
from glob import glob
glob("seoul*.csv")
-> 같은 경로에 파일이 있는지 확인
concat으로 여러 데이터프레임 합치기
df = pd.concat([df_01, df_02])
중복확인하기
-> df[df.duplicated()]
중복제거하기
-> df = df.drop_duplicates()
astype(str)과 str()의 차이
-> astype(str) <= pandas series, str() <= python 문자열
"연도" 컬럼의 비율 구하기
df["연도"].value_counts(normalize=True) * 100
"연도" 컬럼을 통해 빈도수 구하기
df["연도"].value_counts()
연도월에 대한 빈도수 구하기
빈도수를 구하고 sort_index 로 정렬합니다.
-> year_month = df["연도월"].value_counts().sort_index()