서울시 공공자전거 데이터 기반모델 이용, 제주도 대여소 입지 추천 서비스
기대효과
모델 학습을 위한 데이터 변수 설정, 수집
데이터 변수 설정
서울 데이터 수집1 (대여소 / 주변 시설)
서울 데이터 수집2 (유동인구)
학습용 데이터 전처리
예측을 위한 제주 데이터 수집
전처리 데이터 확인
SeoulDataFrame.corr()
기타 사항
다중 선형 회귀 분석
범주화 라벨링 여부
추천: 상위10% / 보통: 10%~80% 구간 / 부적합: 하위20%
모델 분석 비교
모델 | 정확도(Train) | 정확도(Test) | 결과 |
---|---|---|---|
LogisticRegression | 70% | 68% | '적합' 예측 못함 |
K-NN(n=3) | 80% | 65% | 예측비율이 가장 적합 |
Random Forest | 100% | 67.1% | '적합' 예측률이 낮음 |
Xgboost(depth=5) | 100% | 60% | '적합' 예측률이 낮음 |
MLPClassifier | 71.4% | 68.6% | 정확도는 준수하나, '적합' 예측못함 |
모델들을 서비스에 적용해본 결과 K-NN모델이 가장 적합하게 예측해 K-NN을 선택했습니다.
현상1 : 임의 지점 선택시 전반적으로 서울시의 feature값 보다 높은값이 도출.
현상2 : 독립변수에 유동인구 추가 시 좁은 구간 내 심해지는 편차값
가비아에서 도메인 네임을 구입. 호스팅영역 생성.
AWS Route53을 이용하여 사이트 URL을 생성했습니다.
bestjejubike.shop
메인화면
분석지도 페이지
분석결과 페이지
분석결과를 테이블에 출력. 각 장소명을 클릭하여 지점별 분석결과에 대한 시각화 자료를 표시하게 했습니다.
각 지점별 수치는
각 지점 분석결과를 버튼이벤트로 처리. jquery, AJAX 를 이용하여 비동기방식으로 Chart.js로 시각화하도록 했습니다.
로그인서비스를 이용중인 사용자는 이 분석결과를 저장할 수 있습니다.
회원별 분석 이력 페이지
모든 DB 클라우드 서비스는 AWS RDS mysql을 사용하였습니다.