멋쟁이 사자처럼 AI 스쿨 TIL-12

김영민·2022년 10월 6일
0

수치형, 범주형 마다의 어떤 그래프를 써야 적절한지 알아보기.

from glob import glob
glob("seoul*.csv")
-> 같은 경로에 파일이 있는지 확인

concat으로 여러 데이터프레임 합치기
df = pd.concat([df_01, df_02])

중복확인하기
-> df[df.duplicated()]
중복제거하기
-> df = df.drop_duplicates()

astype(str)과 str()의 차이
-> astype(str) <= pandas series, str() <= python 문자열

"연도" 컬럼의 비율 구하기
df["연도"].value_counts(normalize=True) * 100

"연도" 컬럼을 통해 빈도수 구하기
df["연도"].value_counts()

연도월에 대한 빈도수 구하기
빈도수를 구하고 sort_index 로 정렬합니다.
-> year_month = df["연도월"].value_counts().sort_index()

profile
배운걸 다 흡수하는 제로민

0개의 댓글