대학교 자료구조 수업에서 과제로 Amazon 사에서 제공하는 Amazon review dataset을 파싱해서 데이터를 다루는 프로젝트를 진행했었다. Amazon에서 이런 dataset을 제공하는 줄 모르고 있었는데 data의 column들이 흥미롭고 이를 가지고 Ka
Before 저번 포스팅에서는 wget을 사용해 amazon dataset tsv 파일을 다운로드하는 것까지 진행했다. 이번에는 Python Pandas를 사용해 amazon review 중 Shoes category에 해당하는 review들을 파싱해보자. 이번에는
이번에 Amazon review dataset를 여러가지 방면으로 분석하는 프로젝트를 진행하다가 Pandas 모듈에 대해서 한번 정리하고 가야겠다라는 생각을 하게 되었다. 이번 포스팅에서는 저번에 다운로드한 Amazon_shoes_reviews.tsv 데이터셋에서 20