오늘은 스파르타코딩클럽 내일배움캠프 최종프로젝트가 시작된 날이었다.
다행히도 조원들은 잘 만난 것 같다.
다들 소통이 원활하게 되는 것 같고 의견 주고받는게 수월하다.
모두 이커머스, 고객관리 쪽으로 직무희망을 하고 있는 상태였다.
처음으로 아이스브레이킹을 하고 주제에 대한 브레인스토밍 시간도 가졌다.
우선 웹 크롤링으로 데이터를 가져오자는 의견을 시작으로 쿠팡의 데이터를 활용해보고자 하였다.
쿠팡의 리뷰시스템을 가지고 해볼까해서 직접 쿠팡 웹을 보면서 얻을만한 인사이트가 무엇일지 고민했다.
쿠팡 고객에 대한 로그데이터는 가져올 수가 없기 때문에 계속 내심 마음에 걸렸다.
리뷰 데이터를 가져와도 폭넓은 분석이 어려울 것이라 생각했고, 튜터님들 의견 또한 이것은 사이드 프로젝트로 생각해야지 메인으로 하기엔 최종프로젝트에 적합하지 않을 것이란 판단을 내려주셨다. 그리고 웹 크롤링이 쉽지 않을 것이란 의견도 있었다.
따라서, 우리는 튜터님들의 의견을 받고 다시 한번 메인으로 사용될 데이터에 대해서 생각해보기로 했다.
오늘 했던 이야기 중에 리뷰를 가지고 어떤 분석을 할 수 있을까에 대한 의문이 여러 생각을 하게 만들었다.
일단 제일 처음 나온게 고객 세그먼트였다.
그리고 세그먼트가 나오니 자연스럽게 RFM분석, 클러스터링 이야기도 나오게 되었다.
우리 팀이 이커머스를 희망하는 이상, 매출이나 유저 퍼널 같은 것을 무조건 다뤄야한다는 생각으로 바뀌었다. (원래는 리뷰가지고 깊게 파볼까 했었다.)
실무를 접하게 된다면 큰 그림부터 작은 그림으로 나아가야 하는데, 학생의 입장으로 프로젝트를 해보려니 역시 데이터의 부재가 발목을 잡는다. 그렇단건 실제로 실무에서도 이것으로 발목 잡힐 일이 분명 있을거라고 생각이 들었고, 이러한 상황 속에서 어떤 분석을 할 수 있을까..
튜터님들 의견 중에 로그데이터가 있다면 직접 데이터를 만들어서 join 하여 사용하는 방법도 있다고 하였다.
나는 그 순간, 실제 데이터와 가상의 데이터를 섞어도 되나..? 라는 생각을 했지만, 반대로 데이터를 만들어서 몇가지 다른 상황을 대입해서 보면 크게 달라질 것이라는 생각이 들었고, 그 분석의 의미가 향후 마주하게될 데이터가 될 수도 있지 않을까란 생각이 들었다.
어차피 로그데이터란게 쌓이는 데이터인데, 미리 예측한 데이터가 있다고 생각하고 진행해도 무방할 것 같았다.
내일은 이 아이디어를 가지고 기획안 초안을 만들어서 제출할 예정이다.