[5주차] EDA_03

심하림·2023년 6월 3일
0

EDA

목록 보기
4/14

후기
그래프로 그려지고, 보여지는게 확실히 시각화되는 정보가 있어서 재미있는것 같다. 하지만 하나하나 코드를 기억하고 작성하는게 쉽진 않다. 그래도 시각적으로 보여지는게 있으니 재미 있는 것 같기도 ㅎㅎ

CCTV데이터 그래프화

5. 데이터 시각화

  • 다양한 한글 대응 코드

  • 그래프위 정보 사라짐 --> ;

  • kind=" "

kind에 적용될 수 있는 다양한 그래프 디자인

6. 데이터 경향 표시

인구수, 소계 컬럼으로 scatter plot

numpy를 이용한 1차 직선 만들기

  • np.polyfir(): 직선을 구성하기 위한 계수를 계산
  • np.poly1d():polyfit 으로 찾은 계수로 파이썬에서 사용할 수 있는 함수로 만들어주는 기능

7. 강조하고 싶은 데이터를 시각화해보자

그래프 다듬기 - 경향과의 오차 만들기

  • 경향(trend)과의 오차를 만들자
  • 경향은 f1함수에 해당 인구를 입력
  • f1(data_result["인구수"])
  • 오차 구하기

  • 오차데이터 비교

# 정렬
df_sort_f = data_result.sort_values(by="오차", ascending=False) # 내림차순
df_sort_t = data_result.sort_values(by="오차", ascending=True) # 오름차순
  • 행, 열에 맞는 데이터 확인

  • 그래프 세팅(+컬러지정)

from matplotlib.colors import ListedColormap
# colormap 을 사용자 정의(user define)로 세팅
color_step = ["#e74c3c", "#2ecc71", "#95a9a6", "#2ecc71", "#3498db", "#3489db"]
my_cmap = ListedColormap(color_step)

  • 저장
# 폴더에 csv파일로 저장
data_result.to_csv("../data/01. CCTV_result.csv", sep=",", encoding="utf-8")

jupyter note

fp1 = np.polyfit(data_result["인구수"], data_result["소계"], 1) --> x축 인구수, y축 소계를 1차식으로 만들자(polyfit으로 계수를 찾음)
f1 = np.poly1d(fp1) --> polyfit에서 찾은 계수를 넣은 fp1을 poly1d에 넣고 f1에 넣자
np.linspace(a, b, n) --> a부터 b까지 n개의 등간격 데이터 생성
plt.text() --> 그래프에 텍스트 입력
data_result.to_csv() --> data_result를 (괄호)의 폴더위치에 csv로 저장

0개의 댓글