파이썬 머신러닝이 처음이라면 DACON 101 (LV4, 4강 EDA | 다중공선성 Scatter plot)

DACON AI·2021년 8월 10일
0
post-thumbnail

다중공선성

다중공선선은 상관관계가 높은 독립변수들이 동시에 모델에 포함될 때 발생합니다.

만약 두 변수가 완벽하게 다중공선성에 걸려있다면, 같은 변수를 두 번 넣은 것이므로 모델이 결괏값을 추론하는 데 방해가 될 수 있습니다.

다중공선성 확인

다중공선성을 확인 하는 방법은 크게 3가지가 있습니다.

Scatter plot을 통한 확인

Heatmap 그래프를 통한 확인

VIF(Variance Inflation Factors, 분산팽창요인)을 통한 확인

이번 시간에는 첫번째 방법인 Scatter plot을 이용하여 다중공선성을 확인 해보겠습니다.

Scatter Plot(산점도 그래프)는 두 개의 연속형 변수에 대한 관계를 파악하는데 유용하게 사용할 수 있습니다.

강의 확인하러 가기

profile
Dacon

0개의 댓글