데이터분석 5주차-1-1

이정훈·2023년 2월 27일

서울 CCTV

  1. 서울시 구별 CCTV 현황 데이터 확보
  2. 인구 현황 데이터 확보
  3. CCTV 데이터와 인구 현황 데이터 합치기
  4. 데이터를 정리하고 정렬
  5. 그래프를 그릴 수 있는 능력
    6.전체적인 경향을 파악 할 수 있는 능력
    7.그 경향에서 벗어난 데이터를 강조하는 능력
    1~4 : Python , Pandas
    5 : Matplotlib
    6 : Regression using Numpy
    8 : Insight and Visualization

Pandas로 CSV,엑셀 파일 읽기
Python에서 R만큼 강력한 데이터 핸들링 성능을 제공하는 모듈
단일 프로세스에서는 최대 효율
코딩 가능하고 응용 가능한 엑셀로 받아들여도 됨
누군가는 스테로이드를 맞은 엑셀로도 표현함

실습 서울시 CCTV 현황 분석 데이터 읽기
1.터미널(미니콘다 프롬프트)에서 경로를 맞춰서 주피터 노트북을 실행
2. 주피터 노트북에서 import pandas 를 하고 서울시CSV파일을 불러온다. 뒤에 , encoding= "utf-8"

  1. CCTV_Seoul.head() head()함수는 디폴트5로 앞 부분 데이터를 보여준다.

  2. CCTV_Seoul.tail() tail 함수는 디폴트5로 끝 부분 데이터를 보여준다.

5.CCTV_Seoul.columns 로 columns 데이터를 불러올 수 있다.

6.CCTV_Seoul.columns[숫자] 로 columns 데이터 item을 불러올 수 있다.

7.CCTV_Seoul.rename(columns={CCTV_Seoul.columns[0]: "구별"}) 로 rename을 할 수 있는데
여기서 뒤에, inplace=True를 붙이지 않으면 데이터가 바뀐채로 저장되지 않는다.(주의)

7.이번에는 엑셀로 되어있는 파일을 불러와서 원하는 부분만 추출하는 방법을 알아본다.

로 원하는 부분만 추출해서 보여줄 수 있다.
8.우리가 이미 정리되어있는 데이터를 이렇게 만드는 것은 쉽지만 만약 아무것도 모르는 상태에서
찾아야한다면 구글에서 pandas read_excel documentaion 을 검색후 pandas 공식 홈페이지에 들어가면
어떻게 써야하는지 자세히 나와있다.(공부하기)
9. 이제는 excel 파일의 columns 의 값을 변경해보자

profile
데이터 분석 준비생

0개의 댓글