.corr() 특정 x값이 y값에 어떻게 영향을 주는지 확인하기

Yelim Kim·2021년 10월 25일
0

Kaggle

목록 보기
14/29
all_data.corr()['SalePrice'].sort_values(ascending = False)

ascending = False를 인자로 넣어주게 되면 큰 순서로 정렬된다.

이런 출력값을 확인할 수 있다.
여기서는 물론 선형 데이터들만 확인할 수 있고,
음수로 표현된 부분은 반대방향으로 선형 관계가 있다는 것이다. 즉, 절대값이 중요하다.

위 데이터의 설명을 조금 덧붙이자면, 원래 상관 관계가 0.3을 칼럼이 거의 없어야 하는데
여기는 많아서 트리 모델보다 선형 모델이 더 잘먹는다!

만약 문자형의 중요도를 확인하려면 피쳐 임포턴스를 확인하면 된다. 다음 글에서 확인해보자.

profile
뜬금없지만 세계여행이 꿈입니다.

0개의 댓글