데이터 분석에 가장 많이 사용되는 BI tools Tableau를 사용해 제주도 이용객 데이터 연습을 해봤습니다.
데이터는 제주도 공공데이터에서 예비창업자를 위한 업종별 카드매출을 감사하게도 모아놓으셨길래 도전 해봤습니다 :) .
가설 설정
#1. 제주시, 서귀포시 중 제주시에 공항이 있고 공항 근처에 매출들이 높을 것이다.
#2. 젊은 사람들이 매출에 많은 영향을 끼칠것이다.
처음 접근한 방식은 데이터를 연동을 하고 union을 적용하고 19, 20, 21년 데이터를 concat 시킴
'년도'라는 column을 year, month로 새로운 columns을 만들어줌
계산된 필드를 만들어 DATEPART('year', [년도])를 적용하면 year만 출력
--> DATEPART('원하는 부분', [columns])
처음 mapbox를 이용해서 진행하려 했으나 tableau에서 지원해줌
연도별 업종 중분류로 이용금액으로 바 차트 제작
1~2-지표 -> 1번 가설과는 유사하게 다른 부분에서는 제주시에 많은 매출
그러나 2019~2021 년도에 숙박업에서 서귀포시가 더 높은 매출 달성
서귀포시 소매업이 증가하는 추세로 변환
가장 많은 매출은 한식 음식점
2021년 코로나로 인해 지표가 떨어지지않았나라고 예측을 하지 않은 이유
-> 2021/04 데이터만 존재하기에 섣불리 예측하기에는 위험함
연령별 업종 이용금액 시각화
지표-3 :
-> 2번 가설과 다르게 30~50대에 많은 매출
가장 많은 매출은 소매업에서 나오고 두번째는 음식점
현재 제주도 시민들도 포함된 값이라 이후에 한번 제외하고 값을 출력해봐야함.
지표-4 : 업종 대분류로 나눠 비교해본 이용금액
가장 높은 판매액은 1위. 한식음식점
2위. 슈퍼마켓
3위. 주유소
4위. 편의점
계산된 필드를 생성해
SUM([이용금액]) / SUM([매장수])을 만들어 1개의 매장에 이용금액을 추출
->뜻하는 바는 매장 수에 비해 많은 매출이 나오는 업종을 확인하기 위함
1위 겜블링 및 배팅을 하는 카지노
2위 면세점
3위 음식료품위주 종합소매업 (시장이라고 추측)
시각화 하며 나온 결과로 생각했던 가설들이 다 기각이라 조금 더 분석을 해야 결론이 나올 것으로 예상
Tableau: https://public.tableau.com/shared/6CK9T2F8W?:display_count=n&:origin=viz_share_link