# min_impurity_decrease

2개의 포스트
post-thumbnail

[혼공머신] 5-2. 교차 검증과 그리드 서치

Intro. 결정트리 모델로 와인 구분하는 모델 완성! max_depth 바꿔가면서 성능 테스트 여러 번 해서 최적의 모델을 찾아야지 ㅎㅎ 그런데... 이사님🗣️ "최적의 모델을 찾는 건 좋은데, 그 과정에서 자꾸 테스트 세트로 평가를 하면 테스트 세트에만 잘 맞는 모델이 되어버리는 거 아닌가요?" ㅇ ㅠㅇ 1. 검증세트와 교차검증 해결책은 생각보다 간단했다. 테스트세트 말고, 따로 검증용 세트를 또 준비하면 된다! 검증세트 원래는 훈련/테스트만 나눴지만, 이젠 훈련/검증/테스트 3개로 나눔. (보통 20%) ☝🏻일반적인 활용 과정 1) 모델을 훈련세트로 훈련(fit)하고, 검증세트로 평가(score)한다 2) 매개변수 바꿔가며 scor

2023년 1월 28일
·
0개의 댓글
·
post-thumbnail

[혼공머신] 5-1. 결정 트리

Intro. 신상품으로 캔 와인을 출시하려는 한빛 마켓! 야심차게 와인을 제작했는데... 김 팀장🗣️ "하.. 레드와인인지 화이트와인인지 표시가 누락됐어.. 캔에 인쇄된 알코올 도수, 당도, pH 값으로 와인 종류를 구별할 수 있겠어?" 1. 로지스틱 회귀의 단점 그냥 레드/화이트 이진분류니까, 전에 배운 로지스틱 회귀모델로 분류하면 되겠군! ㅋ 데이터 준비 이번에도 pandas로 데이터 불러오고, 몇 가지 살펴보기 .info() : 데이터 타입, 누락 여부, 메모리 크기 등의 기본 정보를 보여주는 메소드 .describe() : 각 열마다 간략한 통계치들을 출력해주는 메소드 ![](https://velog.velcdn.com/images/simon919/po

2023년 1월 28일
·
0개의 댓글
·