04.28 Matplotlib

최고고·2022년 4월 28일
0

데이터 시각화란


  • ls 속성 : 라인형태 바뀜 (line style)

  • marker 속성 :

  • lw, color 속성
    라인 두께, 색 변경할 수 있는 속성

  • marker='o', markerfacecolor='m', markersize=10 마커 색상, 크기 변경해줌

  • 그 외 스타일 옵션

  • 범위
    .xlim()
    .ylim()

  • 틱설정
    plt.xticks([0,3,6])
    x축 설정할때 축의 값을 변경가능
    y축도 변경가능

  • 그리드(격자)

  • 플롯
    legend() : 라벨을 그래프에 표시해주는함수(범례)

  • Barchart

  • plt.text(x[i],y[i],y[i]) x, y 위치, 적을 값

교통사고 데이터 시각화 하기 실습

  • 데이터 불러오기
  • 요일별 건수 시각화

    요일 컬럼의 건수를 세서 변수에 담아줌
    그냥가져오면 값이 인덱싱되지만 대괄호 두개하면 이차원형태의 시리즈로 가져와짐
    그다음 월~일 순으로 정렬해준다

차대차사건중 죽거나 다친사람이 많은 (=사상자 수 컬럼) 발생지시도 시각화

  • 컬럼 정보를 먼저 확인해 본다. 필요한 컬럼이 어떤게 있는지 확인해줌
  • 차대차 정보, 발생지시도 정보 확인함
  • 사상자수 건수 확인, 사고유형 대분류가 차대차인 bool 색인
  • 합계 구해줌
  • final의 인덱스가 x축, 합계해준 사상자수 컬럼이 y축

    .figure(figsize=(,)) ----> 그래프 크기 조정

교통사고가 가장 많이 발생하는 시간대를 알아보고 시각화해보자

  • 시간을 두시간 단위로 쪼갠다. 0~2,3~5,6~8 ... 21~23 시
  • 컬럼 확인하기
  • 맨 뒤 2자리만 이용하기위해서 백의자리로 나눈 나머지! !!!
  • pie 차트를 만들어줌
    구간별 개수를 rs에 담아준다
    plt.figure(figsize=(5,5))
    plt.pie(rs, labels=labels, autopct='%f')
    파이 차트의 결과 값을 보면, label은 순서대로 되어있지만 rs는 정렬이 되어있지 않아서, 차트이 값이 다르다. ===> rs와 라벨의 순서를 맞춰줘야함 -->인덱스 정렬해줌!
  • sort_index()
  • %f 는 소수점이 전부 나옴, 자리수 조정 가능 .nf으로 자리수지정

0개의 댓글