[책 리뷰] 혼자 공부하는 데이터 분석 with 파이썬

Yejin Kim·2023년 2월 25일
0

나는 리뷰어다

목록 보기
1/3

🏁 들어가면서

최근 AI, 그 중에서도 컴퓨터비전 분야에 관심을 가지고 공부를 시작하며 파이썬 공부의 필요성을 느꼈다.
Scikit-learn(사이킷-런), TensorFlow(텐서플로우) 등 파이썬에서 제공하는 머신러닝 라이브러리, 프레임워크가 워낙 풍부하기 때문에 인공지능 분야에서는 주로 파이썬을 사용한다.

대학교에 입학하면서부터 근 4~5년동안 C언어로만 프로그래밍을 해오다가 파이썬을 사용하니 유용한 내장 함수, 라이브러리가 많았다.
문제는 내가 그들을 활용하지 못한다는 점이었다.

아무리 좋은 라이브러리와 함수가 있더라도 내가 그들을 활용하지 못한다면 의미가 없다.
누군가는 이런 공부를 책이 아니라 필요에 따라 검색을 통해 함수를 사용하는 탑-다운(Top-Down) 방식으로 하는 것이 더 좋다고 말할 지도 모른다.
하지만 내 경험에 의하면 이는 기본적인 함수들을 익힌 뒤에 더 적절한 방법인 것 같다.

내가 무엇을 모르는 지도 모르고, 어떤 종류의 함수들이 존재하는 지 그 존재성 조차 판단하기 힘들다면 검색을 하는 것조차 어렵다.
이 책은 파이썬의 라이브러리를 활용해서 데이터를 분석해본 적 없는 독자들에게 그러한 기반이 되어 줄 수 있는 책이다.

📖 책에 관하여

책의 목차는 다음과 같다.

  • Chapter 01 - 데이터 분석을 시작하며
    • 01-1 데이터 분석이란
    • 01-2 구글 코랩과 주피터 노트북
    • 01-3 이 도서가 얼마나 인기가 좋을까요?
  • Chapter 02 - 데이터 수집하기
    • 02-1 API 사용하기
    • 02-2 웹 스크래핑 사용하기
  • Chapter 03 - 데이터 정제하기
    • 03-1 불필요한 데이터 삭제하기
    • 03-2 잘못된 데이터 수정하기
  • Chapter 04 - 데이터 요약하기
    • 04-1 통계로 요약하기
    • 04-2 분포 요약하기
  • Chapter 05 - 데이터 시각화하기
    • 05-1 맷플롯립 기본 요소 알아보기
    • 05-2 선 그래프와 막대 그래프 그리기
  • Chapter 06 - 복잡한 데이터 표현하기
    • 06-1 객체지향 API로 그래프 꾸미기
    • 06-2 맷플롯립의 고급 기능 배우기
  • Chapter 07 - 검증하고 예측하기
    • 07-1 통계적으로 추론하기
    • 07-2 머신러닝으로 예측하기

이 책은 구글 코랩을 통해 모든 실습을 진행한다.
별다른 세팅 없이 브라우저에서 python script를 작성하고 실행시킬 수 있기 때문에 책의 실습을 쉽게 직접 따라해볼 수 있다는 장점이 있다.
구글 코랩의 사용법에 대해서는 Chapter 01에 자세히 기술되어 있다. 이미 사용법을 잘 아는 독자의 경우 01-3 부터 책을 읽어도 괜찮을 것 같다.

목차에서도 알 수 있다시피 데이터를 처리하는 process의 순서에 따라서 chapter가 전개되기 때문에 내용을 follow-up 하기 편했다.
나의 경우에는 데이터를 웹에서 스크래핑하는 작업은 거의 하지 않고 주로 데이터 요약, 시각화, 표현을 해야 하는데
내가 필요한 작업에 따라 파트를 금방 찾아볼 수 있다는 점이 편리했다.

설명하는 함수들에 대하여 거의 전부 실습 코드와 예시가 제공되고 해당 함수가 처리해주는 작업이 무엇인지 부연 설명까지 적혀 있어 코드 이해가 수월했다.

책에서 설명하는 내용이 방대하기 때문에 모든 실습 코드를 작성하기 힘들 수 있는데, 이를 위해 이 책에서는 실습예제 코드를 전부 제공한다.
실습 코드와 더불어 강의도 제공하고 있으니 필요한 독자들은 참고하면 좋을 듯하다.

책의 마지막에 appendix로 배운 함수들이 정리되어 있어 필요한 함수들을 한 눈에 찾아볼 수 있고,

미니북처럼 뜯어서 들고다닐 수 있는 용어 노트까지 들어 있다 🫢

🍎 맺으면서

파이썬을 전혀 모르는 사람들이라면 이 책으로 시작하기 보다는 혼자 공부하는 파이썬을 먼저 보고 이 책을 보면 좋을 것 같다.

이 책은 데이터들을 다룰 수 있는 tool에는 어떤 것들이 있는지, 그 tool을 어떻게 활용할 수 있는 지 학습하고
당연하게도 모든 함수들을 기억할 수는 없겠지만 필요한 때에 "이런 작업을 처리해주는 함수가 있었던 것 같은데" 라는 생각을 할 수 있도록
기반을 다져주는 책이라고 생각한다.

파이썬을 어느 정도 익힌 뒤, 데이터를 파이썬으로 다루는 법에 대해 첫 걸음마를 떼고 싶은 사람들에게 추천한다.


한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다

profile
The World Is My Oyster 🌏

0개의 댓글