[네부캠] Week3 - Matplotlib(2) : Line Plot
학습 정리
Line Plot이란?
- 연속적으로 변화하는 값은 순서대로 점으로 나타내고, 이것을 선으로 나타내는 그래프를 말한다.
- 꺽은 선 그래프, 선 그래프, line chart, line graph 등의 다름 이름으로도 사용된다.
- 시간/순서에 대한 변화에 적합하여 추세를 살피기 위해서 사용한다.
- 시계열 분석에 특화
- 5개 이하의 선을 사용하는 것을 추천 (너무 많은 선은 가독성을 하락시킴.)
- 가독성을 증가시킬 수 있는 구별 요소
- 색상 (color)
- 마커 (marker, markersize)
- 선의 종류 (linestyle, linewidth)
Line Plot 제대로 사용하기
추세에 집중
- 다른 그래프와 다르게 꼭 축을 0에 초점을 둘 필요가 없다.
- 수많은 정보가 포함되어 너무 구체적인 Line plot보다는 생략된 Line plot이 더 나을 수 있다.
- Grid, Annotate 등 부가적인 요소들을 모두 제거
- 디테일한 정보는 테이블과 같은 표로 제공하는 것을 추천한다.
- 생략되지 않는 선에서 범위를 조정하여 변화율을 관찰한다.
set_ylim()
이라는 것으로 y값의 범위를 조절할 수 있다. 당연하게 그래프의 선도 범위에 맞게 변경된다.

간격
- 규칙적인 간격이 아니라면 오해를 불러일으킬 수 있다.
- 규칙적인 간격은 기울기 정보의 오해
- 규칙적인 간격이 아니라면 없는 데이터가 존재한다고 오해
- 규칙적인 간격이 아니라면 각 관측 값에 점으로 표시하여 오해를 줄이는 방법이 존재한다.
보간
- line은 점을 이어 만든 요소이며 --> 점과 점 사이에 데이터가 없기에 이를 잇는 방법을 보간이라고 한다.
- 데이터의 error나 noise가 포함되어 있는 경우에 데이터의 이해를 도울 수 있는 방법이다.
- Presentation에는 좋은 방법일 수 있다.
- 하지만 없는 데이터가 있다고 착각하게 할 수 있다.
- 작은 차이는 없앨 수 있으므로, 일반적인 분석에서는 지양하는 편이다.
- 아래 예시는 smoothing을 적용하고, 빈 부분에 대한 보간이 이루어진 예시이다.

이중 축 사용
- 한 plot에 대해서 2개의 축을 이중 축이라고 이야기 한다.
- 같은 x축에 서로 다른 종류의 데이터를 표현하기 위해서 축이 2개 필요하다.
- 한 데이터에 대해서 다른 단위를 적용하는 경우에도 사용된다.
.secondary_xaxis(), .secondary_yaxis()
사용
- 그러나, 이중 축을 사용하는 것보다 2개의 plot을 그리는 것이 훨씬 가독성이 좋다.