상점 신용카드 매출 예측 경진대회제공 : FUNDA(DACON)data download : DACON2019년 2월 28일까지의 약 3년의 카드 거래 데이터를 이용하여 2019년 3월 1일 ~ 5월 31일 상점별 3개월 총 매출 예측funda_train.csv: st
서울/부산 지역 아파트 실 거래가를 예측하는 모델 개발 경진 대회제공 : DACON - 직방data download : DACON-아파트 실거래가 예측소스 코드(& smaple data) : GitHub데이터train.csv : 모델 학습용 데이터 \- transact
자영업 사장님이 되었을 때, 매장 최적의 위치를 찾기 위해 시작하였으나, 지도학습을 위한 '라벨'에 해당하는 '매출'등과 같은 데이터는 외부에서 구할 수 없었다.그래서 비지도 학습으로 인허가 시설들 및 생활인구수를 바탕으로 밀도를 '군집화'하여 군집별 특성을 찾아낸 후
임의로 나눈 둘 이상의 집단에 서로 다른 컨텐츠를 제시한 뒤, '통계적 가설 검정'을 이용하여 어느 컨텐츠에 대한 반응이 더 효과적인지 파악하는 방법.소스 코드 및 테스트 자료 참고 : GitHub온라인 쇼핑몰 페이지 구성에 따른 다양한 실험 결과를 바탕으로 '전활율'
문제 정의 장비 고장 발생하면 전체 공정이 중지가 되어 손해가 발생한다. 고장이 나기 전 사전 이상징후를 포착하고 점검을 통해 고장이 발생하여 미치는 손실을 줄이고자 한다. 진행 데이터 확인 장비의 이상징후를 포착하기 위해 장비의 특정 위치의 충돌 센서 4개(S1~S
(태양렬 발전)전력 발전량은 기상 날씨에 따라 변동이 심하기 때문에 전력 예산 수립에 어려움을 겪고 있다. 2017년 1년치에 대한 데이터를 활용하여 전력발전량 예측하는 모델을 만들고 일기예보에 데이터를 활용하여 전력발전량을 예측 및 전력사용계획을 세우고자 한다.기상
문제 정의 동일 등급의 와인 맛에 대한 변화로 인해 고객 클레임이 발생하여 해결하려 한다. 와인은 1-9등급까지의 등급이 있고 7등급부터 프리미엄 와인으로 고가에 판매가 되는데, 공정에서 최대한 많은 프리미엄 와인의 생산을 증대시키려고 한다. 품질 등급에 영향을 끼치는
와인은 1-9등급까지의 등급이 있고 7등급부터 프리미엄 와인으로 고가에 판매가 되는데, 공정에서 최대한 많은 프리미엄 와인의 생산을 증대시키려고 한다.품질 등급에 영향을 끼치는 공졍을 확인하여 일정한 맛의 와인을 프리미엄 등급으로 생산을 증대하고자 한다.소스코드 : G
문제 정의 주식 및 코인 투자가 열풍이 불면서 은행의 정기 예금 가입자가 감소하고 있으며 마케팅 비용 투자 대비 효율이 낮은 상황이다. 고객의 프로필 조건에 따른 가입률 비교를 통해 예금 상품 가입율을 높이려고 한다. 고객의 프로필 조건들을 분석하여 가입/미가입의 차
문제 정의 신용카드 대금의 채무 불이행 고객으로 인한 손실이 늘어나고 있는 상황이다. 신용카드 채무 불이행이 예상되는 고객들을 예상 및 한도를 관리하여 손실을 방지하려 한다. 데이터 확인 고객 ID별 카드 상세 |ID|LIMIT_BAL|SEX|EDUCATION|MA
문제 정의 카드 기록(실제 상거래 데이터)을 활용한 사기 거래 탐지 데이터 확인 출처 : 캐글(kaggle) 소스코드 : GitHub 해당 데이터는 라벨 데이터를 제외한, 매우 많은 특징(컬럼) 432개를 가지고 있다. 그 중에서 중요하다 판단되는 특징만 가져와
문제 정의 Bosch사의 조립 공정 라인의 모든 단계에 대한 데이터를 분석하여, 제품의 불량을 예측한다. 데이터 확인 출처 : kaggle 소스코드 : GitHub 제공된 데이터의 특징 numeric/categorical data로 구분 데이터샘플은 적고 특징(컬
문제 정의 업데이트 버전을 적용하기 전에 업데이터의 컨텐츠와 방식에 대한 전반적인 내용이 변경될 때 유저의 반응을 테스트 AB test 다양한 웹페이지, 어플리케이션, 게임, 마케팅 등 서로 다른 2개의 상황에서의 반응률을 비교하여 어떤 상황이 더 효과적인지 판단하는
신용 데이터를 활용하여 사기 거래로 인한 고객 클레임 및 고객 탈퇴 등을 미연에 방지하고자 한다.소스 코드 : GitHub데이터 특징numeric/categorical data로 구분데이터 샘플도 많고 특징도 많은 데이터결측치가 존재사기 거래 예측 문제 답게 클래스 불
문제 정의 구매 데이터를 통해 영업 이익 및 서비스 이용 고객 파악 데이터 확인 데이터 및 소스 코드 : GitHub 데이터 상세 |InvoiceNo|StockCode|Description|Quantity|InvoiceDate|UnitPrice|CustomerID
문제 정의 예약 취소와 노쇼로 인해서 영업 이익이 감소하고 있다. 그래서 호텔 예약 취소와 노쇼 비율 현황 파악 및 고객 특성별 데이터를 확인 및 분석. 데이터 확인 데이터 및 소스코드 : GitHub 데이터 상세 |hotel|iscanceled|leadtime|
문제 정의 고객 여정의 페이지를 분석하여 고객 이탈 및 종료를 줄이고 잔존율을 높여야 한다. 데이터 확인 데이터 및 소스코드 : GitHub 데이터 상세 |Administrative|AdministrativeDuration|Informational|Inform