멋쟁이 사자처럼 AI 스쿨 TIL-15

김영민·2022년 10월 12일
0

모든 컬럼이 출력되게 설정합니다.
-> pd.options.display.max_columns = None

melt로 Tidy data 만들기

  • pandas의 melt를 사용하면 데이터의 형태를 변경할 수 있습니다. df_first 변수에 담긴 데이터프레임은 df_last에 담겨있는 데이터프레임의 모습과 다릅니다. 같은 형태로 만들어주어야 데이터를 합칠 수 있습니다. 데이터를 병합하기 위해 melt를 사용해 열에 있는 데이터를 행으로 녹여봅니다.

annot은 과학적 표기법 출력을 의미하고, fmt는 표기법의 형식입니다

결측치 제거 -> dropna()
중복값 제거 -> drop_duplicates()

정규표현식 : regex
[ ] : 일치시킬 문자 세트의 패턴
[가나다] : 가 or 나 or 다 중에 하나를 포함하고 있는지
[가-힣] : 한글 가부터 힣까의 문자 중 하나를 포함하고 있는지
[0-9] : 0~9까지의 숫자 중 하나를 포함하고 있는지
[^0-9] : 숫자를 포함하고 있지 않음
[^가-힣] : 한글이 포함되어 있지 않음
[가-힣+] : 한글이 하나 이상 포함되는지

px.histogram == seaborn 의 barplot과 유사한 기능
plotly express histogram 으로 x="달러", y="국가권역" 합계 구하기
-> px.histogram(df_country, x="달러", y="국가권역")
px.histogram에서는 histfunc을 이용

plotly express histogram 으로 x="달러", y="국가권역" 합계 구하기
color="항목", barmode="group“
-> px.histogram(df_country, x="달러", y="국가권역", histfunc="sum", color="항목", barmode="group")

  • barmode : 옆으로 비교 가능
profile
배운걸 다 흡수하는 제로민

0개의 댓글