박스오피스의 영화관련 데이터를 이용하여 다양한 기법의 머신러닝을 학습시켜본 뒤 가장 정확도가 높은 모델을 채택하여 해당 모델을 기반으로 개봉 전 영화 관객수를 예측해주는 웹어플리케이션을 개발했다.
도매상 고객들의 품목별 연간 지출액을 담은 데이터 셋을 이용하여 EDA와 클러스팅을 통해 회사의 매출을 증대하기 위한 전략을 세워보았다.
kaggle의 "Country Socioeconomic Data" 데이터셋을 이용해 군집화를 해보고 각 군집들이 갖고 있는 특성을 분석해보았다.
다이아몬드 데이터 EDA에 사용했었던 kaggle의 데이터셋을 이용하여 가격과 상관계수가 높은 요소를 채택하여 단순선형회귀를 통해 가격을 예측해보았다.
펭귄의 데이터를 이용하여 회귀를 통해 펭귄의 무게를 예측해보려고 한다.
kaggle의 호주의 날씨 관련 데이터셋을 이용하여 로지스틱 회귀 모델을 학습시킨 후 날씨를 예측해보았다.
kaggle의 식당 방문자수 변화 데이터셋을 이용하여 공휴일과 주말 유무가 방문자수 예측에 어떤 영향을 주는지 확인해보려고 한다.
kaggle의 전력소비량 데이터를 이용하여 여러 예측 ML model을 학습시킨 후 전력소비량을 예측해보려고 한다.
kaggle의 런던의 자전거 공유 수요량 데이터셋을 이용하여 시계열 예측 모델을 학습시킨 후 자전거 수요량 예측 모델을 만들어보려고 한다.
kaggle의 다양한 버섯의 정보를 이용하여 다중 분류를 통해 식용 버섯 유무를 판단할 수 있는 모델을 만드려고 한다.
타이타닉 데이터셋을 이용하여 MLP Classification을 통해 생존자 분류 모델을 만들어보고자 한다.