Northwind Database 분석 - 가설검증, 대시보드 제작

김재현·2022년 10월 17일
0

project

목록 보기
8/12

Northwind Database 분석 프로젝트에 대한 내용입니다.

코멘토 직무부트캠프를 통해 SQL 실무 프로젝트를 진행했습니다. 캠프명은 "SQL 입문부터 활용까지 - 데이터 분석 보고서 작성과 대시보드 개발"입니다.


1. 프로젝트 목적

Northwind Database는 Northwind라는 가상의 식품회사에 대한 샘플 데이터입니다. 이 데이터를 가지고 가설을 세우고 검증하며, SQL을 활용한 데이터 분석 방법을 숙달시키고자 합니다.


2. 가설 검증

데이터를 살펴보면, 행동 주체에는 상품을 공급하는 Supplier, 상품을 판매하는 Employee, 그리고 상품을 구매하는 Customer가 있습니다. 그 중에서도 Employee가 어떻게 배치되어 있는지 궁금했습니다.

1.1 첫번째 가설

상품의 주문건이 많은 지역에, 직원들이 많이 배치되어 있을 것이다

Northwind Traders는 유통회사이기 때문에 상품의 주문건이 많은 지역에 인력을 많이 배치했을 것이라고 생각했습니다. 이 가설이 맞는지 확인하기 위해 상품의 주문건이 많은 지역과, 지역별 Employee의 수를 구해보았습니다.

우선, Northwind의 주문 데이터에서 구매를 진행한 사람들의 지역을 집계함수로 카운트하였습니다. 이를 통해 주문건이 많은 지역을 알아낼 수 있었습니다.

다음으로, 현재 Employee들이 어느 지역에서 근무를 하고 있는지 확인해보았습니다.

결과를 확인해보면, 상품의 주문건이 적은 Seattle에 Employee가 가장 많이 배치된 것을 알 수 있었습니다.

Northwind Trader에서 단순히 주문건이 많다고 직원을 많이 배치하는 것은 아니었음을 알 수 있었습니다. 첫번째 가설은 사실과 달랐습니다.


1.2 두번째 가설

직원이 많이 배치된 지역에서의 매출이 가장 많을 것이다.

그렇다면 Employee의 배치는 주문건이 아니라 지역별 매출의 규모에 영향을 받을 수 있겠다고 생각을 했습니다. 그래서 위와 같은 가설을 세워 검증해보았습니다.

이를 확인하기 위해 앞서 구한 지역별 Employee 수와 함께 지역별 매출액 합계를 구해 비교해보기로 하였습니다.

지역별 매출액 합계를 구하기 위해 위의 쿼리문을 작성하였습니다. 이제 이 데이터를 살펴보겠습니다.

데이터를 확인해보면, 지역별 매출액 합계와 지역별 Employee의 수는 무관함을 알 수 있습니다. 두번째 가설도 사실과 달랐습니다.


1.3 세번째 가설

워싱턴 주에서의 물류량이 가장 많을 것이다

두 번의 가설이 모두 틀려 Google Maps로 해당 지역을 확인해보았습니다. Employee의 근무지역을 확인해본 결과 모두 미국 워싱턴 주에 모여있다는 것을 알 수 있었습니다.

이렇게 직원들을 워싱턴 주에 모두 배치한 것은 워싱턴 주에서 물류량이 가장 많기 때문이 아닐까 하는 생각이 들었습니다. 그래서 이를 확인해보고자 주별로 선박들이 오고 가는 물류량을 확인해보았습니다.

하지만 워싱턴에서의 물류량은 다른 주에 비해 저조한 편이었습니다.

동시에 주별 매출액 합계도 다른 주에 비해 비교적 규모가 적다는 것을 알 수 있었습니다. 이렇게 세번째 가설도 사실과 다름을 확인했습니다.


1.4 결론

현재 Northwind Traders의 인력은 워싱턴주에 모두 배치되어 있습니다. 하지만 워싱턴 주는 주문량도 적고, 물류량도 적고, 매출액 합계도 비교적 저조한 지역입니다. 그래서 업무의 효율이 떨어지지는 않는지 확인해볼 필요가 있습니다.

그래서 테스트를 제안해볼 수 있습니다. 주문량이 많거나, 매출액 합계가 높은 지역에 프로젝트 팀을 신설하여 동일기간의 업무 성과를 측정하여 비교를 해볼 필요가 있습니다.

만약 지역별로 업무 성과에 영향이 없으면, 현행체재를 유지하고 타지역에서의 성과가 우수하면 회사의 이전을 고려해볼 수 있습니다.


3. 대시보드 제작

위의 가설과 검증을 보고서 형식으로 전달하면서, 동시에 Northwind Traders의 현황을 확인할 수 있는 대시보드를 제작해 공유했습니다.

시기별, 지역별, 카테고리별 주문량과 매출액을 확인할 수 있게끔 구성하였습니다. 텍스트, 막대차트, 파이차트, 맵 차트 등을 활용해 제작하였습니다.

0개의 댓글