파이썬 라이브러리인 numpy 와 pandas를 배웠다.
연습문제 좀 풀어야지
어제 배웠던 pandas DataFrame을 불러와서 데이터를 분석할 수 있도록 전처리하는 과정에 대해 배웠다.
특히, 시계열 데이터를 한번도 다뤄본 적이 없었는데 시계열 데이터를 처리하는 방법에 대해 배울 수 있었다.
Matplotlib을 활용하여 데이터를 시각화 하였다.
EDA & CDA에 대해 자세하게 공부할 수 있었다.
또한, 하나의 변수를 분석하는 단변량 분석에 대해 배웠다.
변수 간의 관계를 파악하는 이변량 분석에 대해 종합적으로 실습하였다.
데이터에는 숫자형 데이터와 범주형 데이터가 있는데, 변수 별로 어떤 데이터에 속하는지 파악하는 것이 가장 먼저 선행되어야 한다는 것을 배웠다.
이변량 분석에 대해 남은 것들을 배웠다.
산점도, barplot, Mosaic 등등 용어는 익숙했으나 언제 어떻게 어디에 쓰이는지 정확하게 설명하지 못하였는데, 이제는 어디에 쓰이는지 언제 쓰이는지 남들에게 설명할 수 있다!
이번 한 주는 데이터 처리 및 분석에 대해 배웠다.
데이터 분석에 관심을 갖고 있었지만 학과 특성 상 수업에선 접하지 못했던 부분이라 따로 개인적으로라도 공부를 하려고 계획했었다.
이렇게 체계적으로 데이터 처리 및 분석에 관한 사이클을 살펴볼 수 있어서 정말 좋았다!
생각보다 더 비즈니스 영역에 깊게 들어가 있다는 생각을 하였다...