온라인 쇼핑몰 데이터 활용

yozzum·2022년 3월 25일
0

Article

목록 보기
2/5

패션유통기업의 온라인 쇼핑몰 데이터 활용

그냥 주저리주저리... 천천히 내용을 수정할 예정이다.

서론

앞으로 무엇이 유행할지에 대한 추론을 하려면 어떤 정보가 필요할까.
일단 특정 고객에게 특정 상품을 추천하는 개인 맞춤형 상품추천이 가장 이상적일 것이다. 이를 위해 필요한 것은 아래의 고객의 과거 구매 내역과 상품의 개별 정보이다.

  1. 고객 정보: 고객의 취향을 파악하기 위해 과거 쇼핑 데이터는 필수적이다. 회원이라면 어떤 페이지에 얼마나 머물렀는지 등 로그데이터를 활용할 수 있다. 고객 정보에 대한 여러 문제가 있지만 가장 큰 어려움은 특정 아이디를 공유하거나, 자신을 위한 것이 아닌 다른 사람을 위해 상품을 브라우징하거나 구매하는 행위를 구분하는 일이다.
  2. 상품 정보: 상품 자체에 대한 데이터도 중요하지만, 통계적 오류가 없을 만큼의 좋아요 수, 구매 건수 등 특정 상품에 대한 정보가 필요하다. 예를 들어, 특정 기간에 가장 인기있었던 상품이 무엇인지 파악하는데 충분한 데이터를 확보하지 못한다면 이상치와 같은 오류가 발생한다.
    • 인기도: 개별 상품에 대해 상품 클릭 수, 좋아요 수, 구매 건수, 장바구니에 담긴 수 등이 집계 될 수 있어야 한다.
    • 재질: 고가와 저가에 따라 어느 정도 고정이 되어있기 때문에 상대적으로 큰 변동은 없는 듯 하다.
    • 색깔: 주기적으로 트렌드 컬러가 있다. 몇 가지가 정해지면 이에 어울리는 색 또한 정해져 있기 때문에 상대적으로 큰 변동은 없는 듯 하다.
    • 브랜드: 특정 브랜드를 대체할 수 있는 브랜드들이 있다. 기존의 브랜드가 될 수도 있고, 새로 떠오르는 브랜드가 될 수도 있다.
    • 패턴: 유행에 따라 특정 패턴의 디자인이 유행할 수 있다. 다른 요소에서도 마찬가지이지만, 패션을 리드하는 패션쇼나 유명 디자이너의 작품, 연예인 패션을 캐치하는 것이 중요하다. 크롤링 기술과 도메인 전문가의 필터링 작업이 요구된다.
    • 핏: 유행에 따라 스탠다드 핏, 오버핏 등으로 나뉠 뿐아니라, 개인 취향과 더불어 측정하기 어려운 정보이다.
    • 베이직/개성: 지오다노, 유니클로 등과 같이 베이직함을 추구하는 브랜드와 Thursday Island, 폴로처럼 개성이 강한 브랜드들이 있다. 이들을 적절히 카테고리로 나눌 수 있으면 좋은 데이터가 될 수 있지만, 패션에 대한 지식이 깊은 도메인 전문가의 annotation 작업이 필요하기에 쉽지않다.
    • 사이즈: 브랜드 쇼핑몰마다 사이즈 측정법이 달라서 소비자는 제품 구입 전에 입어보길 원한다. 사이즈를 두 개 주문해 입어보고 하나를 반품하는 경우도 많고 이를 위한 서비스도 나오고 있다.
    • 상품명/모델명: 각 상품에 대한 key값은 데이터 관리에 핵심이다. 하지만 온라인에서나 오프라인에서나 이것이 통일되어 있지 않아 데이터 활용이 쉽지 않다.

위에 언급한 대부분의 데이터는 일관성 없이 등록되고 있다. 예를 들어 브랜드 마다 검정색을 bk, bl, black 등 다르게 표기하고, 브랜드 고유의 컬러명을 사용하기도 한다. 이와 같은 문제를 해결하기 위해 옴니어스 태거와 같은 상품인식 기술이 떠오르고 있다. 하지만 수 없이 쏟아지는 상품 이미지를 일일히 확보하는 것은 큰 비용일 뿐만 아니라, 이미지 데이터가 확보되고 기술이 아무리 뛰어나다고 하더라도 새로운 패턴에 대한 annotation, 핏, 사이즈에 대한 데이터에 대한 것은 기술적으로 해결하기 힘들다.

시간대 별로 특정 고객이 어떤 상품에 관심을 가졌고 어떤 상품을 구매하는 것을 파악하는데는 데이터, 기술, 인력 모든 관점에서 한계가 있다. 특히 직매입이 아닌 경우 더욱 어렵다.
이 상황에서 DT를 통해 새로운 인사이트를 얻는데 최선은 무엇일까. 좀 더 포괄적인 범위에서 의사결정을 지원할 수 있지 않을까

본론

전체 고객이 어떤 브랜드/상품에 관심을 보이고 구매를 했는지 파악하면 MD, 바이어의 의사결정을 지원할 수 있지 않을까.
상품 클릭에서 좋아요나 구매로 이어지는 전환율을 파악하는 것이 더 큰 의미가 있지만, 유통기업의 입장에서 유통 채널은 다양하다. 자사몰이 아니라면 소비자 행동에 대한 로그데이터를 확보하는것은 어렵기 때문에 브랜드/상품에 대한 관심은 좋아요 클릭 수로 제한될 것이다.

가설:

  1. 좋아요 수와 구매건수(매출)에는 상관관계가 있다.
  2. 좋아요 수와 구매건수의 상관관계에는 시차가 존재한다. 이 시차가 클수록 MD, 수요 예측 의사결정에 대한 도움이 된다.
  3. MD의 의사결정에 관하여: 트렌드가 바뀔 때마다 잘하는 브랜드와 잘 못하는 브랜드를 나눌 수 있다. 따라서 어떤 브랜드를 쇼핑몰 화면의 어디에 위치 시킬지, 프로모션을 어떤 식으로 진행할 지에 대한 의사결정에 도움이 될 수 있다.
  4. 수요 예측 의사결정에 관하여: 개별 상품에 대한 좋아요 수를 기반으로 매입할 물량을 파악하는 예측하는데 도움이 될 수 있다.

결론

위 가설을 검증하기 위해서는 시계열 데이터가 필요하다. 지금 당장 하고싶다고 할 수 있는 것이 아니라, 프로젝트 아키텍쳐와 방법론을 구현해 놓고, 데이터를 확보하면서 주기적으로 가설 검증을 시도해야한다.

당장 이상적인 DT를 구현하는 것이 불가능하다면 현재 활용가능한 기술과 가용 데이터를 기반으로 인사이트를 도출할 수 있는 차선책은 무엇일까를 고민하다가 흐른 생각이다.

profile
yozzum

0개의 댓글