데이터분석 5주차-1-1

이정훈·2023년 2월 27일
0

서울 CCTV

  1. 서울시 구별 CCTV 현황 데이터 확보
  2. 인구 현황 데이터 확보
  3. CCTV 데이터와 인구 현황 데이터 합치기
  4. 데이터를 정리하고 정렬
  5. 그래프를 그릴 수 있는 능력
    6.전체적인 경향을 파악 할 수 있는 능력
    7.그 경향에서 벗어난 데이터를 강조하는 능력
    1~4 : Python , Pandas
    5 : Matplotlib
    6 : Regression using Numpy
    8 : Insight and Visualization

Pandas로 CSV,엑셀 파일 읽기
Python에서 R만큼 강력한 데이터 핸들링 성능을 제공하는 모듈
단일 프로세스에서는 최대 효율
코딩 가능하고 응용 가능한 엑셀로 받아들여도 됨
누군가는 스테로이드를 맞은 엑셀로도 표현함

실습 서울시 CCTV 현황 분석 데이터 읽기
1.터미널(미니콘다 프롬프트)에서 경로를 맞춰서 주피터 노트북을 실행
2. 주피터 노트북에서 import pandas 를 하고 서울시CSV파일을 불러온다. 뒤에 , encoding= "utf-8"

  1. CCTV_Seoul.head() head()함수는 디폴트5로 앞 부분 데이터를 보여준다.

  2. CCTV_Seoul.tail() tail 함수는 디폴트5로 끝 부분 데이터를 보여준다.

5.CCTV_Seoul.columns 로 columns 데이터를 불러올 수 있다.

6.CCTV_Seoul.columns[숫자] 로 columns 데이터 item을 불러올 수 있다.

7.CCTV_Seoul.rename(columns={CCTV_Seoul.columns[0]: "구별"}) 로 rename을 할 수 있는데
여기서 뒤에, inplace=True를 붙이지 않으면 데이터가 바뀐채로 저장되지 않는다.(주의)

7.이번에는 엑셀로 되어있는 파일을 불러와서 원하는 부분만 추출하는 방법을 알아본다.

로 원하는 부분만 추출해서 보여줄 수 있다.
8.우리가 이미 정리되어있는 데이터를 이렇게 만드는 것은 쉽지만 만약 아무것도 모르는 상태에서
찾아야한다면 구글에서 pandas read_excel documentaion 을 검색후 pandas 공식 홈페이지에 들어가면
어떻게 써야하는지 자세히 나와있다.(공부하기)
9. 이제는 excel 파일의 columns 의 값을 변경해보자

profile
데이터 분석 준비생

0개의 댓글