본 내용은 인프런 강의 <데이터 분석을 위한 판다스>를 수강하며 중요한 점을 정리한 글입니다.
판다스 튜토리얼
How do I create plots in pandas?
https://pandas.pydata.org/pandas-docs/stable/getting_started/intro_tutorials/04_plotting.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.plot.html
: 두 데이터 사이에 무슨 관계가 있는지 확인. 산점도가 우상향하면, 둘은 양의 상관관계가 있는 것.
우하향하면 둘은 음의 상관관계가 있다는 걸 확인할 수 있다. 우상향, 우하향 둘 다 아니고 데이터가 뭉쳐있으면 두 데이터는 아무 관계가 없는 것.
air_quality.plot.scatter(x='station_london', y='station_paris', alpha=0.5)
: 각각의 축에 있는 데이터들이 어떤 식으로 분포해있는지 보여주는 대표적인 시각화 방법론 중 하나
박스플롯에 대하여
https://boxnwhis.kr/2019/02/19/boxplot.html
air_quality.plot.box()
: Make separate subplots for each column.
디폴트로 각 컬럼에 대해 서브플롯을 만들어준다.
air_quality.plot.area()
air_quality.plot.area(subplots=True)