[논문 스터디] 변화에 대응할 수 있는 수요예측 모델을 위한 상황별 전략

Oni·2024년 4월 13일
0

TimeSeries

목록 보기
3/3

수요예측에 있어서, 이상적인 계획은 어떤 상품의 과거 판매량데이터와 판매량에 영향을 미치는 변수 관련 데이터를 확보하고 최적의 알고리즘 모델을 적용하여 안정적인 수요예측 프로세스를 운영하는 것이지만 실제에서는 1. 모델링 할 상품들의 변화 2. 트렌드/현장 상황의 변화 등의 변수가 존재한다.

이번 포스팅에서는 다양한 변화, 변수의 상황에 대해 대응하기 위한 수요예측 기술을 다룬 논문들에 대해 정리해보고자 한다.


  • 첫번째는 여러 상품에 대한 예측 모델링을 관리할 때에 대한 참고 전략이다. 상품마다 판매주기, 판매량 변화( ex. 냉면 같은 시즌성 제품) 가 다르기 때문에 상품의 성격별로 다르게 접근해야 하는 것이 좋지만 상품의 갯수가 몇십개가 넘어가게 되면 현실적으로 하나하나 살펴볼 여유가 없다.

A.상품 수요 패턴과 클러스터를 고려한 월간 상품 수요 예측 모델 성능 비교 연구

1) 운영의 관점에서 취할 수 있는 전략 중 하나는 최근 n개월간 판매량비중이 높은 상품을 우선적으로 관리하는 것이다.

2) 모델링의 관점에서 취할 수 있는 전략 중 하나는 바로 상품들의 수요 패턴에 따라 그룹핑하여 관리하는 것이다.

⭐수요 패턴 분류 방법

  • ADI(Average Demand Interval)와 CV(Coefficient of Variance) 기준으로 4가지 패턴 분류
    • ADI = 주문이 발생하는 평균적인 주기 = 총 일수를 총 주문 횟수로 나눈 값.
    • CV = 수요간의 변동성(변화폭)을 나타내는 지표= 수요의 표준편차 / 수요량의 평균

    • smooth : 일정한 수량의 수요, 규칙적 주기
    • lumpy : 일정하지 않은 수량의 수요, 규칙적 주기
    • intermittent:일정한 수량의 수요, 불규칙적인 주기
    • erratic : 일정하지않은 수량의 수요, 불규칙적 주기

연구방법

사용 데이터

  • Kaggle에서 제공하는 Online Retail Dataset
  • 해당 데이터는 2년 동안의 온라인 쇼핑몰 거래 이력 데이터 542,014 건

정상성 테스트

  • adfuller 모듈을 사용하여 ADF 정상성 검정 진행
  • 유의 수준 0.05 이내의 상품 996개 선별

ADI, CV 기반 수요패턴 분류

  • 수요패턴 4종류로 분류된 상품 그룹에서 최근 6개월 동안의 수요량을 기반으로 2차 클러스터링 수행

Sliding Window 생성

💡 Sliding Window

  • 과거 날짜의 값을 현재 예측하려는 값의 독립변수로 활용하는 방법

XGboost 모델 사용하여 예측 수행


  • 두번째는 다양한 판매채널을 통한 주문, 수시적으로 발생하는 이벤트로 인한 주문량 변화가 심한 e커머스 풀필먼트 비즈니스에 활용가능한 수요예측 기술에 대한 제안이다.
  • 본 연구에서 제안하는 멀티 조합 수요예측 기술은 풀필먼트 센터 내 피킹과 패킹 작업 인력을 최적화하고 1+1과 같은 온라인 판촉 행사 이벤트로 인한 주문 예측의 불확실성을 감안하고 예측해 안정적인 상품 출고를 가능하게 한다는 점에서 의의가 있다.
  • 관련 연구가 2022년과 2023년(아마도 2022년에 대한 후속 연구로 보임) 진행됨

B. 풀필먼트 센터 최적 운영을 위한 수요예측 방법 연구(2023)

연구방법

사용데이터 : 사용 예측 변수

  • e커머스 수요예측에서 가장 중요한 변수는 제조사 혹은 e커머스 플랫폼사에서 발행한 쿠폰, 할인 판매와 같은 이벤트 변수이다.

    💡 상품의 프로모션 여부는 중요한 예측변수로 활용될 수 있겠다.

  • 이벤트에 대한 정보 수집을 위해 이커머스 플랫폼, 공공데이터 포털 등에서 이벤트 데이터 수집
- 한국은행에서 수집하는 소비치줄 전망조사
- 소비자 심리지수
- 쇼핑몰 내 할인행사 정보 
  • 이벤트 관련 데이터 수집 후 주, 월, 분기 등의 형태로 분류하여 예측 가능한 패턴이 있는, 없는 이벤트로 분류

  • 이커머스 플랫폼내 대표적 패턴이 있는 이벤트인 타임특가는 이벤트 정보 업데이트 주기에 따라 일 2회 수집하고 이를 머신러닝 모델 기반으로 수요예측에 활용

  • 플래시세일(Flash sale)과 같은 패턴이 없는 이벤트 행사에 대해서는 딥러닝 모델 기반으로 수요예측에 활용

    💡 패턴이 있는 경우는 머신러닝, 패턴이 없는 경우는 딥러닝으로 접근 방식을 달리 할 수 있겠다.

💡 비즈니스 모델에 따라 달라지는 수요예측의 목적성

  • Amazon은 매입 상품 기반 주문 예측을 한다. e커머스 풀필먼트 비즈니스 모델의 대표적 사례로 자체 주문 플랫폼을 통한 주문에서부터 판매, 상품 매입, 중계, 보관, 배송까지 End to End 비즈니스를 수행하기 때문이다.
  • 이와 달리 C사는 다양한 e커머스 주문 플랫폼과 연계하는 협업 비즈니스를 하고 있어 물류센터 운영에 필요한 수요예측이 필요하다. 일 2회 수요예측을 진행하며, 이를 기반으로 6~8시간내 배송하는데 이를 위해서는 자체적으로 해당 제품이 언제 팔릴지를 예측-재고 준비-피킹-패킹-출고-배송 프로세스를 수행해야 함.
  • 주문에 대한 예측과 주문 플랫폼 할인행사, 제조사 수행 이벤트들의 예측을 통해 풀필먼트 센터에서 적시에 포장되어 배송이 이루어질 수 있도록 주문 예측과 이벤트 예측이 가능한 딥러닝&머신러닝 기반의 멀티조합 수요예측 모델 생성

Baseline 모델과 Best 모델 선정

  • 기존에 학습데이터가 많은 고객과 신규입점하여 데이터가 부족한 고객을 구분해 수요예측.

이벤트 변수 비교를 통한 보정 모델 구현

  • S사가 실행하는 이벤트가 기존 주문과 이벤트 분석 패턴과는 다른 양상을 보일 경우 현재 기준 과거 동일 요일 8주간의 평균 주문량과 이벤트들을 비교 분석하고 현재 시점의 주문에 이벤트가 어떤 영향을 줄 것인지에 대한 분석 예측을 하게 됨.
  • 이렇게 생성된 S사의 예측결과를 사용해 결과값을 보정.

Multi-combination 전자상거래 수요예측 모델

  • MA(1), MA(2), Random Forest, Lasso, Xgboost 등 8개의 분석 알고리즘 사용
  • 과거 60일 간의 주문데이터를 바탕으로 고객사 특성, 물성, 이벤트 등의 다양한 변수를 반영해 정확도가 가장 높은 2가지 알고리즘을 선택

    💡 학습데이터의 범위가 2달이라고 하더라도 트렌드를 잡는 유효변수를 설정하는 것이 중요하다.


Reference

  • https://frepple.com/blog/demand-classification/
  • 상품 수요 패턴과 클러스터를 고려한 월간 상품 수요 예측 모델 성능 비교 연구 (남효연)
  • 풀필먼트 센터 최적 운영을 위한 수요예측 방법 연구(김영남, 류상천, 김현)
profile
데이터 분석/엔지니어링/ML에 관한 기록

0개의 댓글