[부스트캠프 AI Tech 5기] Line Plot

Line Plot
- 연속적으로 변화하는 값을 순서대로 나타내고, 이를 선으로 연결한 그래프
- .line이 아니라 .plot()
- 시간 순서에 대한 변화에 적합하여 추세를 살피기 위해 사용
요소
- 5개 이하의 선을 사용하는 것을 추천
- 색상 | 마커 | 선의 종류로 구별 됨
전처리
- Noise로 인해 추세 파악이 어려울 경우가 다수
- smoothing을 통해 noise의 인지적인 방해를 줄임
주의
- 꼭 축을 0에 둘 필요가 없음
- 구체적인 line plot 보다 생략된 line plot이 날 수도 있음
간격
- 규칙적인 간격이 아니라면 오해를 줄 수 있음
- 규칙적인 간격의 데이터가 아니라면 관측 값에 점을 표시하여 오해를 줄이기
보간
- Line은 점을 이어 만드는 요소 -> 점과 점 사이에 데이터가 없기에 이를 잇는 방법
- 데이터의 error나 noise가 포함 되어 있는 경우 데이터의 이해를 돕는 방법
- presentation에서는 smoothing이 좋은 방법이겠지만, 일반적인 분석에서는 지양 할 것
이중 축 사용
- 한 Plot에 대해 2개의 축을 이중 축이라고 함
- 같은 시간 축에 서로 다른 종류의 데이터 .twinx()
- 한 데이터에 대해 서로 다른 단위 .secondary_xaxis(), .secondary_yaxis()
- 이중 축 보다는 두개의 그래프를 그리는 것을 추천
ETC
- 각 끝 단에 레이블을 추가하면 식별에 도움 (범례 대신)
- annotation으로 min/max 정보를 표시하면 도움이 될 수 있음
- 보다 연한 색을 사용하여 uncertainty 표현 가능 (신뢰구간, 분산 등)