[나도코딩] 다중 선형 회귀

HYl·2022년 11월 6일
0

나도코딩_머신러닝

목록 보기
5/12

  • 회귀는 연속형 변수
    • 독립변수에 문자형 변수가 있을 때, 숫자로 변환 시켜줘야 한다.
    • 원-핫 인코딩을 이용하여 변환시켜줌
      • 표현하고 싶은 값만 1로, 나머지는 모두 0으로

  • Home + Library + Cafe = 1

다중 공산성 (Multicollinearity)

  • 독립 변수들 간에 서로 강한 상관관계를 가지면서 회귀계수 추정의 오류가 나타나는 문제
  • 하나의 피처가 다른 피처에 영향을 미침
  • D3 = 1 - (D1 + D2) 식이 성립이 된다는 것은, 독립 변수들 간의 상관 관계가 있다는 뜻.
  • 독립 변수들 간의 높은 상관관계를 가질 때에는, 해결이 필요함.
    • 해결하는 방법은 ? columns들 중, 하나의 column을 제외시킴

독립 변수들 간의 높은 상관 관계를 가질 때, 해결 방법

  • Dummny Columns이 n개면? n-1개만 사용
    • Dummy Variable Trap
profile
꾸준히 새로운 것을 알아가는 것을 좋아합니다.

0개의 댓글