데이콘 101 강의 리스트 보러가기
강좌 수강하기
강의 내용 확인하기
강의 확인하기
강의 확인하기
Lv1. 의사결정회귀나무로 따릉이 데이터 예측하기 5강 EDA 결측치 확인하기(is_null()) 강의 확인하기
강의 링크
강의 링크
강의 링크
강의 링크
강의 링크
강의 링크
강의 링크
13강 모델링 6/6 제출파일생성(to_csv())강의 링크
강의 링크
데이콘 머신러닝 교육 콘텐츠, LV2 1강
Lv2. 결측치 보간법과 랜덤포레스트로 따릉이 데이터 예측하기
Lv2. 결측치 보간법과 랜덤포레스트로 따릉이 데이터 예측하기 3강 모델링 1/2 랜덤포레스트 개념, 선언 강의 링크
Lv2. 결측치 보간법과 랜덤포레스트로 따릉이 데이터 예측하기
Lv2. 결측치 보간법과 랜덤포레스트로 따릉이 데이터 예측하기 6강 튜닝 2/5 변수 제거 강의링크
Lv2. 결측치 보간법과 랜덤포레스트로 따릉이 데이터 예측하기 7강 튜닝 3/5 하이퍼파라미터 GridSearch 개념 강의 링크
강의 링크
강의 링크
강의 확인하기
강의콘텐츠 링크
강의 콘텐츠 링크
강의 콘텐츠
강의 콘텐츠
강의 콘텐츠
강의 콘텐츠
Lv3. 교차검증과 LGBM 모델을 활용한 와인 품질 분류하기 모델 실습 RandomForestClassifier() 강의 콘텐츠
교차 검증 정의 K-Fold강의 콘텐츠이번 시간에는 "교차검증"에 대해서 이야기해보겠습니다.교차 검증을 이야기 하기 위해서는, Hold-out 에 대해서 먼저 이야기 해야 합니다.Hold-outHold-out은 단순하게 Train 데이터를 (train, valid)라는
강의 콘텐츠 링크
Lv3. 교차검증과 LGBM 모델을 활용한 와인 품질 분류하기 15강 튜닝 | Bayesian Optimization 강의 콘텐츠
강의 콘텐츠
\> 강의 콘텐츠
DACON 101 (LV4, 1강)Lv4 EDA 1/5 python 파이썬 seaborn pairplotseaborn의 pairplot은 데이터에 들어 있는 각 컬럼(열)들의 모든 상관 관계를 출력합니다.3차원 이상의 데이터라면 pairplot 함수를 사용해 분포도를
seaborn의 distplot 함수는 데이터의 히스토그램을 그려주는 함수입니다. 히스토그램이란 수치형 데이터 분포를 정확하게 표현해주는 시각화 방법입니다. 변수를 여러 개의 bin으로 자르고(사용자 지정) bin당 관측수를 막대그래프로 표현합니다.강의 링크
다중공선성다중공선선은 상관관계가 높은 독립변수들이 동시에 모델에 포함될 때 발생합니다.만약 두 변수가 완벽하게 다중공선성에 걸려있다면, 같은 변수를 두 번 넣은 것이므로 모델이 결괏값을 추론하는 데 방해가 될 수 있습니다. 다중공선성 확인다중공선성을 확인 하는 방법은
히트맵 (Heat Map)히트맵은 두개의 범주형(Categorical) 변수에 대한 반응변수의 크기를 색깔의 변화로 표현하는 것입니다.예를 들어, 일 별 기온을 보고자 할때 , 매일 온도를 히트맵으로 표현하여 온도 변화의 추이를 볼 수도 있습니다. 데이터 분석 과정에
이번에는 변수의 다중공선성을 확인하는 방법 중 하나인 VIF(Variance Inflation Factors, 분산팽창요인)에대해 알아 보겠습니다. 👋VIF는 변수간의 다중공선성을 진단하는 수치이며 범위 1부터 무한대입니다.통계학에서는 VIF 값이 10이상이면 해당