프로젝트 Github 주소 : https://github.com/Jinmun-Park/seoul_tradehub
'서울 열린데이터광장'에서 제공하는 빅데이터를 이용한 ML/DL 활용 프로젝트를 구상하던 중, 상권 데이터와 의료시설 및 학교 등 상권과 연계되어 서울시에 위치한 상권의 매출을 예상할 수 있는 모델을 만들 수 있겠다고 생각했다.
이미 API 웹사이트 (https://ourdatapark.com) 프로젝트를 통해 HTML / CSS 를 어느 정도 활용할 수 있었기에, 상권 데이터를 분석하고 리포트를 만든 후 모바일 앱 개발을 시도하기로 결정했다.
필요한 앱 개발 기술은 어느 때와 같이 맨땅에 헤딩하며 배우는 걸로 진행하되, 데이터 분석만큼은 꼼꼼하게 검증하며 리포트를 작성하는 방향으로 정했다.
프로젝트의 최종 목적은 사용자가 서울시 내에서 좌표/지역구/행정동과 업종을 입력하면, 월별/분기별 예상 매출 금액을 예측해 제공해주는 모바일 앱을 배포하는 것이다.
프로젝트는 아래와 같은 순서로 진행한다.
(1) 추출한 모든 데이터를 분석하여 EDA를 포함한 데이터 분석 리포트 작성
(2) 이후 분석 결과를 활용하여 ML/DL을 활용한 모델을 구축
(3) 예측 모델이 완성되면 앱 제작 후 배포
깃헙에 프로젝트 기획을 작성하였고, API 웹사이트 프로젝트를 진행했던 경험을 기반으로 조금 더 타이트한 타임라인을 계획했다.
PLAN | DATE | STATUS |
---|---|---|
데이터 맵핑 | 31'DEC'2021 | IN PROGRESS |
EDA 리포트 | 7'JAN'2022 | IN PROGRESS |
모델링 | 14'JAN'2022 | IN PROGRESS |
최종 리포트 | 18'JAN'2022 | IN PROGRESS |
PLAN | DATE | STATUS |
---|---|---|
FLASK 앱 | 31'JAN'2021 | IN PROGRESS |
AWS | 10'FEB'2022 | IN PROGRESS |
정확한 데이터 출처 또한 깃헙에 공유하였다.
이름 | 출처 | 파일 이름 |
---|---|---|
상권데이터 | 서울 열린데이터 | 상권_데이터 이름 |
공영주차장 | 서울 열린데이터 | 도로명별_공영주차장 |
문화공간정보 | 서울 열린데이터 | 도로명별_문화공간정보 |
병원인허가 | 서울 열린데이터 | 도로명별_병원인허가 |
어린이보호구역 | 서울 열린데이터 | 도로명별_어린이보호구역 |
전월세가 | 서울 열린데이터 | 도로명별_전월세가 |
등록외국인구별현황 | 서울 열린데이터 | 서울시 등록외국인 구별 현황 |
의료관광허가의료기관정보 | 서울 열린데이터 | 서울시 의료관광허가 의료기관 정보 |
서울특별시 건축물대장 법정동 코드정보 | 서울 열린데이터 | 법정동코드 |
행정동코드 | 한국빅데이터 | 행정동코드 |
이직과 취업을 준비하며 다양한 프로젝트를 진행하고 싶었고, 이번 프로젝트를 통해 빅데이터를 활용한 데이터 분석에 초점을 두고 싶었다. 모바일 앱으로 배포하는 것에 대한 궁금증도 평소 가지고 있었기에 이 모두를 경험하기에 좋은 주제라고 생각했다.