조미정 강사님 (데이터 분석)
04_탐색적데이터분석
02_공공자전거 현황 분석
03_업무추진비 분석
서울시 업무 추진비 분석
데이터 분석의 주제 선정
데이터 수집
2-1. 깃허브에서 파일 다운로드
2-2. 파일 전체 다운로드 함수
2-3. 2018-2021 파일 다운로드
데이터 처리
3-1. 파일 살펴보기
data frame 구조 살펴보기
3-2. 2021년 데이터 처리
1) 데이터 합치기
2) 결축치 확인
3) 칼럼 이름 변경&삭제
4) 데이터를 파일로
5) 2021년 파일 존재유무 확인
3-3 2018-2021 파일 합치기
1) 연단위로 파일 만들기
2) 연단위 파일 합치기
3) 2018-2021 파일 모두 합치기
4) 테이터 살펴보기
5) 칼럼 drop하기
6) 칼럼 이름 변경하기
데이터 분석
4-1. 연도별 추이 분석
4-2. 연도별 집행금액 분석
4-3. 월별 집행금액 분석
4-4. 부서별 집행 내역 분석
1) 부서레벨1별 집행금액 분석
2) 부서레벨2별 집행금액 분석
3) 집행금액이 큰 순으로 top10
4) word cloud로 시각화
4-5. 요일별 집행 내역 분석
4-6. 시간대별 집행 내역 분석
data analysis project
사용하기 좋은 적절한 dataset을 찾는 것이 너무 어렵다. 몇일을 검색해봐도 마음에 드는 것이 없었다. 강사님께서도 고충을 예상하셨는지 참고하면 좋을 만한 dataset을 여러가지 제시해주셨다.
더 찾아봐야지..!