[네부캠] Week3 - Matplotlib(2) : Line Plot

오홍석·2024년 8월 27일
0

네부캠

목록 보기
11/28

학습 정리


Line Plot이란?

  • 연속적으로 변화하는 값은 순서대로 점으로 나타내고, 이것을 선으로 나타내는 그래프를 말한다.
  • 꺽은 선 그래프, 선 그래프, line chart, line graph 등의 다름 이름으로도 사용된다.
  • 시간/순서에 대한 변화에 적합하여 추세를 살피기 위해서 사용한다.
  • 시계열 분석에 특화
  • 5개 이하의 선을 사용하는 것을 추천 (너무 많은 선은 가독성을 하락시킴.)
  • 가독성을 증가시킬 수 있는 구별 요소
    • 색상 (color)
    • 마커 (marker, markersize)
    • 선의 종류 (linestyle, linewidth)

Line Plot 제대로 사용하기

추세에 집중

  • 다른 그래프와 다르게 꼭 축을 0에 초점을 둘 필요가 없다.
    • 추세를 보기 위한 목적이 위주이기 때문이다.
  • 수많은 정보가 포함되어 너무 구체적인 Line plot보다는 생략된 Line plot이 더 나을 수 있다.
    • Grid, Annotate 등 부가적인 요소들을 모두 제거
    • 디테일한 정보는 테이블과 같은 표로 제공하는 것을 추천한다.
  • 생략되지 않는 선에서 범위를 조정하여 변화율을 관찰한다.
    • set_ylim()이라는 것으로 y값의 범위를 조절할 수 있다. 당연하게 그래프의 선도 범위에 맞게 변경된다.

간격

  • 규칙적인 간격이 아니라면 오해를 불러일으킬 수 있다.
    • 규칙적인 간격은 기울기 정보의 오해
    • 규칙적인 간격이 아니라면 없는 데이터가 존재한다고 오해
  • 규칙적인 간격이 아니라면 각 관측 값에 점으로 표시하여 오해를 줄이는 방법이 존재한다.

보간

  • line은 점을 이어 만든 요소이며 --> 점과 점 사이에 데이터가 없기에 이를 잇는 방법을 보간이라고 한다.
  • 데이터의 error나 noise가 포함되어 있는 경우에 데이터의 이해를 도울 수 있는 방법이다.
  • Presentation에는 좋은 방법일 수 있다.
  • 하지만 없는 데이터가 있다고 착각하게 할 수 있다.
  • 작은 차이는 없앨 수 있으므로, 일반적인 분석에서는 지양하는 편이다.
  • 아래 예시는 smoothing을 적용하고, 빈 부분에 대한 보간이 이루어진 예시이다.

이중 축 사용

  • 한 plot에 대해서 2개의 축을 이중 축이라고 이야기 한다.
  • 같은 x축에 서로 다른 종류의 데이터를 표현하기 위해서 축이 2개 필요하다.
    • .twinx() 로 이중축 사용
  • 한 데이터에 대해서 다른 단위를 적용하는 경우에도 사용된다.
    • .secondary_xaxis(), .secondary_yaxis() 사용
  • 그러나, 이중 축을 사용하는 것보다 2개의 plot을 그리는 것이 훨씬 가독성이 좋다.
profile
기동코딩

0개의 댓글