데이터분석 스터디 6회차

Seongkeun·2021년 8월 30일
1
post-thumbnail

지난 1주일간..

산림 복지로 인한 수익 현황 공공데이터를 찾아보았다. 공공데이터를 찾을 수가 없어 이번에도 "정보공개포털" 을 이용하여 두가지 데이터를 신청하였다.

요청 데이터

대상요청 데이터정보 공개 여부
산림청, 산림복지진흥원1. 시설별 복지프로그램 수익현황
2. 시설별 산림제품 수익현황
진행 중

아직 요청한 데이터를 받지 못해 "네이버 부스트코스 태블로 시각적분석" 강의를 듣고 산림 복지 관련해 수집된 데이터를 기반으로 테스트를 진행해 보았다.

태블로 테스트


(이용할 두 xlsx(테이블)간의 연관관계)

Table Join


(프로그램 인증 현황.xlsx 중 일부)
위 연관관계의 좌측에 해당하는 데이터



(산림복지 전문업 등록현황.xlsx 중 일부)
위 연관관계의 우측에 해당하는 데이터

보는 바와 같이 프로그램 인증현황.xlsx정확한 지역명 이 표기가 되어 있지 않고 프로그램 전문업 종류(biz_type 부분)가 명시되어 있지 않아 카테고리 범위를 더 넓히고자 테이블을 조인하였다. (기관명을 축으로 조인하였다)

but !

하지만 산림복지 전문업 등록현황.xlsx프로그램 인증 현황.xlsx 이 갖고있는 만큼의 기관명 이 등록되어 있지 않았다.

(null 데이터가 굉장히 많아서 사용할 수가 없다)

테스트 결과

산림복지 전문업 등록현황.xlsx 데이터 만으로 테스트를 진행하였고 테스트 결과는 다음과 같다.

(이미지를 클릭하면 아래를 실제 구현한 태블로 페이지로 넘어간다. 클릭시 유동적으로 차트들이 변동하게 대시보드를 만들었다)

SeongkeunOh의 산림복지 테이블

회의 내용

ㅈㅎ은 일이 늦게끝나 불참할수 밖에 없었고 이브는 우리가 이번 공모전 접었는 줄 알았다고 한다...ㅠㅠ
그래서 회의내용은 위 내용이 전부이다..

다음 스터디까지..

  1. 부스트코스 태블로 고급까지 공부
  2. 정보공개 포털을 통해 청구한 데이터가 오면 시각화 작업 추가

느낀점

태블로 공부하며 부스트코스 강의에 설명되지 않은 기능에 관해 이것 저것 검색해보며 적용해 보았다. 정규표현식을 사용해서 100몇 가지 데이터를 9가지로 축약해보기도 하였고 위에 설명한 테이블 조인, 연관관계 지정도 해 보았다. 태블로 공부할 수록 그 매력에 빠져들었던 한 주였다. 재밌군..!

profile
지혜는 지식에서 비롯된다

0개의 댓글