파이썬의 기초를 알아보자.
해당 챕터에서는 이 책 전반에 걸쳐 사용하게 될 파이썬 언어에 내장되어 있는 기능을 살펴본다.
파이썬의 함수와 파일 핸들링에 대해 알아보자
numpy의 핵심 자료구조 ndarray의 기능을 살펴보자
numpy의 유용한 함수들의 활용법에 대해 알아보자
pandas pandas는 앞으로 데이터 분석에 있어서 자주 살펴볼 라이브러리다. pandas는 고수준의 자료구조와 파이썬에서 빠르고 쉽게 사용할 수 있는 데이터 분석 도구를 포함하고있다. pandas가 Numpy의 스타일(벡터화된 데이터 처리,배열 기반의 함수제공)을 많이 차용했지만, 가장 큰 차이점은 pandas는 표 형식의 데이터나 다양한 형태의 데이...
파이썬 표준 라이브러리 pandas로 데이터를 원하는 형태로 가공해보자.
python의 matplotlib 라이브러리를 통해 데이터를 시각화 해보자.
Seaborn 라이브러리를 활용해서 데이터를 시각화하여 보자.
GroupBy Mechanic에 대해 알아보자
pandas를 활용하여 데이터를 집계해보자.
pandas를 이용해서 pivot_table과 crosstab을 사용해보자.
python의 datetime class에 대해 알아보자.
날짜 범위에 따른 데이터를 생성하는 방법과 오프셋, 또 데이터 시프트에 관해 다뤄보자
지역마다 다른 시간대에 맞추어 시계열 데이터를 변환하는 방법을 알아보자.
pandas의 period class에 대해 알아보자.
resample을 이용하여 기간 빈도를 업샘플링, 다운샘플링해보자.
시계열 데이터 분석에서 rolling, expanding, ewm 등의 이동창 함수를 활용해보자
pivot을 활용해서 데이터를 재형성해보자!!
pandas 클래스(DataFrame, Series)에 통계 계산을 적용, 그리고 원하지 않는 value를 제외 시키거나 다른 값으로 대체시켜 보자.
pandas를 활용하여 데이터를 원하는 형태로 변환해보자
대부분의 경우 데이터는 분석하기 쉽지 않은 형태로 기록되어 있다. 해당 Log에서는 데이터를 합치고, 재배열할 수 있는 도구들을 살펴보자. 계층적 색인(Hierarchical Indexing) 계층적 색인은 Pandas의 주요 기능 중 하나인데 축에 대해 다중 색인을 지원한다. 추상적으로 높은 차원의 데이터를 낮은 차원의 형식으로 다룰 수 있게 해주는...
두 DataFrame 합치는 방법(concat, combine_first, merge, join)을 알아보자