〈어쩌다 데이터 분석 with 파이썬〉 (김유지, 한빛미디어)

Даня[다냐]·2023년 3월 21일
0

서평

목록 보기
2/12
post-thumbnail

〈어쩌다 데이터 분석 with 파이썬〉

도서명저자출판사출간일예제 파일
어쩌다 데이터 분석 with 파이썬김유지 [이메일|블로그]한빛미디어2022.09.29.링크

이 책은...

"데이터 분석"이 무엇이며 어떻게 진행되는지부터 어떤 라이브러리를 어떻게 사용하여 할 수 있는지, 그리고 어떻게 활용할 수 있는지 이야기한다. 데이터를 합치고 변형하며 요약 및 집계를 하고 시각화를 하는 등 다양한 응용법을 넓게 설명해줌으로써 독자들이 필요에 맞는 방식으로 데이터 분석을 활용할 수 있게 도와준다.

Chapter 1에서는 데이터 분석을 위한 환경 설정을 하고, 이 분야를 처음 접하는 독자들을 위해 데이터 분석에 필요한 파이썬 기초 문법의 핵심을 가볍게 훑어준다.

Chapter 2에서는 데이터 분석을 하기에 앞서 익혀두어야 할 numpy 라이브러리와 pandas 라이브러리의 데이터 타입 및 주요 함수 등 기본적인 내용들을 짚고 넘어감으로써 본격적인 데이터 분석을 시작할 수 있는 토대를 마련해준다.

Chapter 3에서는 결측값, 이상값 등의 이슈로 데이터를 있는 그대로 사용하기 어려울 때 해당 이슈를 어떻게 처리할 수 있는지 다양한 경우의 수를 보여줌으로써 데이터 정제를 하는 법을 익힐 수 있도록 한다.

Chapter 4에서는 흩어져 있는 데이터를 분석하기 위해 병합해야 할 필요가 있을 때, 상황에 맞게 위아래 또는 좌우로 적절하게 병합하는 방법을 알려준다. 데이터 병합 시 고려해야 할 부분들과 처리하는 방법을 다양하게 열거한다.

Chapter 5에서는 데이터를 그룹화하여 처리한 후 다시 결합하는 방법과 적용하기 좋은 함수들을 알아본다. 피벗 테이블 등 다른 데이터 분석 도구에서 유용하게 쓰이는 기능을 판다스에서는 어떻게 수행할 수 있는지 확인할 수 있다.

Chapter 6에서는 시계열 데이터의 종류와 그것을 다루는 방법에 대해 이야기한다. 시간의 흐름에 따라 관측하여 인덱스가 날짜 및 시간 형식으로 작성되는 날짜시간 데이터를 활용하기 위해 날짜시간 인덱스를 어떻게 처리할 수 있는지 다룬다.

Chapter 7에서는 맷플론립과 시본을 통해 라인그래프, 히스토그램, 막대그래프, 산점도, 박스플롯, 바이올린그래프로 데이터를 시각화하는 방법을 알아보고, 각각의 그래프를 사용하기에 적합한 상황과 적용할 수 있는 속성에 대해 알아봄으로써 다양한 형태의 데이터를 시각화하는 방법을 익힌다.

마지막으로 Chapter 8에서는 그동안 학습한 것을 바탕으로 캐글에서 제공하는 넷플릭스 데이터를 정제하고 파생 변수를 만드는 등 전처리 과정을 거쳐 이를 통해 뽑아낼 수 있는 다양한 정보를 시각화하는 시간을 갖는다. 시각화는 기초와 고급으로 나누어 독자의 수준에 맞게 접근할 수 있다. 데이터 시각화 고급까지 마쳤다면 다양한 기준을 스스로 만들어가며 책에서 함께 하지 않은 부분에 대한 시각화도 할 수 있을 것이다.

전반적으로...

"데이터 분석" 자체를 처음 해보는 사람의 경우 "이게 뭔지 왜 설명을 안해주지?" 하면서 머뭇거릴 수 있지만 약간의 구글링으로 해결 가능한 수준이기는 하다.

엑셀 스프레드시트를 많이 사용했다면 피벗에 대한 개념은 이미 익숙할 것이다. 데이터를 피벗하면 데이터를 재구성할 수 있다.

이 부분은 "피벗"에 대해 충분한 설명인지 의문이다. 나는 엑셀 스프레드시트를 사용해본 적이 없어 해당 개념은 검색해서 대략 이해했다.

바꿔 말하면, 데이터 분석을 조금이라도 접해본 적 있는 사람에게는 아는 내용을 굳이 다시 설명하지 않고 "그래서 그것을 파이썬으로는 어떻게 하는가"에 초점을 맞춰 핵심적인 부분만 잘 추려낸 책이라고 할 수 있다.

그러면서도 첫 번째 장에서 데이터 분석에 대한 개요를 설명함으로써 데이터 분석을 처음 접하는 사람들도 어렵지 않게 접근할 수 있도록 하였다.

이런 사람에게...

데이터 분석에 처음 입문하는 사람에게도 도움이 되지만, 데이터 분석에 처음 입문하는 사람보다는 엑셀 등 프로그래밍 외적인 데이터 분석을 어느 정도 접한 경험이 있는 사람이 "파이썬을 활용한" 데이터 분석이 처음일 때 특히 유용할 것 같다.


📚 한빛미디어 〈나는 리뷰어다〉 활동을 위해서 책을 제공받아 작성된 서평입니다.

profile
연극인 정단휘 鄭丹輝; 가끔은 출판인; 어쩌면 체육인?; 개발자들 사이에서 다른 이야기를 중얼거려 봅니다👀

0개의 댓글