데이터 시각화의 목적은 비즈니스의 발견을 위함.
한계로 그래프와 통계량은 대부분 정보(원본)를 요약함. -> 요약하는 관점에 따라 결과가 달라짐 -> 정보 손실 발생
Import matplotlib.pyplot as plt : 라이브러리 불러오기
plt.plot(x, y, ‘’, data = ) : 기본 라인차트 그리기
plt. savefig(‘a’) : 그래프 이미지 파일 저장
plt.show() : 그래프 출력
plt.xlabel() : x 축 레이블 추가
plt.ylabel() : y 축 레이블 추가
plt.title() : 그래프 제목
plt.plot(x, y, ‘b.-’, data = )
색+마커+라인스타일 순
표기 | 색 |
---|---|
'b' | blue |
'g' | green |
'r' | red |
'c' | cyan |
'y' | yellow |
'k' | black |
'w' | white |
표기 | 내용 |
---|---|
'.' | pointmarker |
',' | pixel marker |
'o' | circle marker |
'v' | triangle_down marker |
'^' | triangle_up marker |
'<' | triangle_left marker |
'>' | triangle_right marker |
'1' | tri_down marker |
'2' | tri_up marker |
'3' | tri_left marker |
'4' | tri_right marker |
's' | square marker |
'p' | pentagon marker |
* | star marker |
표기 | 색 |
---|---|
'-' | solid line |
'--' | dash line |
'-.' | dash dot line |
':' | dotted line |
plt.plot(x, y, ‘b.-’, data = , label = '') : 마지막에 label 입력
plt.legned() : 범례 나타내기
plt.grid() : 그리드 추가
plt.xlim(시작값, 끝값) : 그래프 지정범위로 그려짐
plt.figure(figsize=(가로, 세로) : 크기 조정
plt.axhline(y값, 색, 라인스타일) : 수평선
plt.axvline(x값, 색, 라인스타일) : 수직선
plt.(x좌표, y좌표, '내용') : 글자추가
plt.subplot(행, 열, 인덱스) : 그래프 여러개 그리기
plt.tight_layout() : 그래프 간 간격을 조정
Exploratory Data Analysis
탐색적 데이터 분석
개별 데이터의 분포 탐색(NA, 이상치 파악)
Confirmatory Data Analysis
확증적 데이터 분석
통계적 분석 도구 사용
데이터들의 변수는 범주형과 숫자형으로 구분할 수 있다.
하지만 숫자로 저장된 자료가 범주형 자료일 수 있고
숫자형 자료도 범주형 자료도 아닐 수 있다.
데이터를 분석하는 과정과 방법을 배운 시간이었다. 분석을 하기 위한 낯선 개념들이 익숙하지 않아서 쉽지 않았던것 같다. 데이터를 시각화하는 새로운 방법들을 추가로 알게되어 유익했다. 미니 프로젝트 진행 시에 사용해보면 데이터를 직관적으로 확인할 수 있어 유용할 것 같다.