미리 사 놨던 책이었는데, 그동안 시간이 없어서 이제서야 시작하는 것 같다... Kaggle의 대표적인 경진대회를 통해 데이터 분석부터 문제 해결 능력까지 기를 수 있는 좋은 책이라고 생각이 들어서 구매하게 되었고, 캐글 가입 절차는 이미 예전에 가입해놓았으니 생략하고
저번 포스팅에서는 kaggle 환경에서 notebook을 실행하기까지 진행했었다. 이번 포스팅에서는 kaggle에서 제공하는 notebook 환경을 둘러보고 여러 기능들을 사용해보는 시간이 되겠다.캐글 노트북 실행 화면왼쪽 최상단은 현재 노트북 제목을 표시하는 영역이다
1. 탐색적 데이터 분석(EDA)과 그래프 그래프를 활용해 데이터가 어떻게 구성돼 있는지, 어떤 피쳐가 중요한지, 어떤 피처를 제거할지, 어떻게 새로운 피처를 만들지 등 모델링에 필요한 다양한 정보를 얻을 수 있다. 이번 포스팅에서는 탐색적 데이터 분석(EDA)에
3. 범주형 데이터 시각화 >seaborn을 import하고 data loading하는 code
이번 포스팅에서는 데이터 관계를 시각화하는 방식들에 대해 글을 작성하겠다.분량이 얼마 되지 않아 짧은 포스팅이 될것같다.히트맵, 라인플롯, 산점도, 회귀선을 포함한 산점도를 살펴볼 예정이다.비교해야할 데이터가 많을 때 주로 사용하며, heatmap() 함수를 이용한다.
이번 포스팅은 "1부. 머신러닝 레벨업의 지름길. 캐글" 파트에서 "04장. 데이터를 한눈에: 주요 시각화 그래프"를 알아보는 파트의 정리를 마치고, 2부로 들어가 본격적으로 06장부터 진행되는 머신러닝 경진대회를 진행하기 전에, "05장. 다시 살펴보는 머신러닝 주요
[경진대회] 자전거 대여 수요 예측 이번 포스팅에서는 본격적인 경진대회 관련 글을 작성할 예정이다. 우선 이번 포스팅이 kaggle 경진대회에 처음 참가해보는 포스팅이니만큼 경진대회 세부 메뉴를 알아보고 안내사항을 숙지하는 내용을 작성할 것이다. 1. 경진대회 이