(사전학습자료 1) 인과추론의 어려움

2innnnn0·2022년 2월 14일
0

https://youtu.be/Hy4QXihPPMI

사전학습자료1) 인과추론의 어려움

왜 인과관계인가?

  • 오비이락

    • 까마귀 날자 배 떨어진다.
    • 실제로 까마귀가 날아서 배가 떨어지는 것은 아님. (인과관계)
    • 상식선에서 위 예시가 인과관계가 아니라는 것은 잘 알지만, 현실 문제에서는 인과관계를 파악하는 것이 쉽지 않음.

상관관계와 인과관계

  • 상관관계인과관계를 의미하지 않는다. Correlation does not imply Causation.
    • 상관관계 : 함께 일어나는 변화
    • 인과관계 : 원인과 결과
  • 상관관계 사례
    • 아이스크림 판매량 ~ 익사사고 건수
  • 인과관계 사례
    • 여름철 기온 ~ 아이스크림 판매량
    • 여름철 기온 ~ 익사사고 건수
  • 생활 속 상관관계와 인과관계
    • 대머리가 판매성과가 좋다. → 그러니 머리를 밀자.
      • 이것은 우연히 일치한 상관관계임.
    • 마요네즈 소비량 ~ 이혼률 → 둘이 상관관계가 있다고 말할 수 있지만, 실제로 인과관계가 있다고 볼 수 없다.

  • 사회과학 속 상관관계와 인과관계
    • 인플루언스 마케팅의 효과
      • 인플루언서가 추천한 상품이 잘 팔린다는 것은 합리적인 추론.
    1. 내(인플루언서)가 홍보한 상품을 내 친구가 구매했다면 그건 내 덕분일까?
      • Dual Graph A‚ention Networks for Deep Latent Representation
        of Multifaceted Social E€ects in Recommender Systems 논문링크

- 취향/특성의 유사성 Homophily(호모필리) (**상관 관계**)
    - (a) 내가 구매하고, 친구가 구매했을 때.
        - 나로 인해 구매한게 원래 각자가 같은 취향을 갖고 있었다.
        - 즉, 어떤 추천에 의한 것에 의한 주문이 아님. 이럴 경우 인과 관계가 아님.
        - 친구와 동시에 구매했다는 이유로 인과 관계를 추론할 수 없음.
        - 친구 : “나도 그게 좋아서 샀다.”
    - (c) 추천시스템에 의해서 옷을 구매했을 때
        - 유사한 옷을 구매했을때, 추천에 의한 것보다는 원래 내가 그 옷을 사려고 했었다, 결국 인과관계로 구매한 것이 아닌 것.
- 동료 효과 Peer Effect, Soical Influence (**인과 관계**)
    - (b) 친구 혹은 인플루언서의 추천으로 인해 실제로 구매할 경우. 이것은 인과관계로 볼 수 있음
- 잘 살펴보면 위 취향의 유사성과 동료 효과가 데이터 상으로 보면 구분하기가 어렵다. 이것이 우리가 현실 문제에서 상관, 인과 관계를 이해하기가 어려운 이유다. (데이터로는 a,b 모두 동일한 케이스)
  1. 검색엔진에 홈페이지 광고를 내는 것이 효과가 있을까?

    • 유료검색(paid search)의 효과가 자연검색(organic search)보다 좋다는 것을 어떻게 증명할 수 있을까?

      • 보통 ROAS를 측정한다. (유입수 대비 구매수)
      • 100만원 마케팅비를 태워 1000만원의 매출이 발생했다면 10배의 ROAS를 측정할 수 있다.
      • 하지만, 몇가지 시나리오를 예시로 측정이 매우 어렵다는 것을 확인할 수 있다.
    • A그룹(Macy's 비고객 10명), B그룹(Macy's 고객 10명)가 있을 때

    • 시나리오1

      • 위 사진은 기대되는 효과. A그룹은 기존 검색대로 들어오고, 광고를 통해 B그룹들이 추가로 들어오길 원함
    • 시나리오2

      • 유료광고와 자연검색이 동시에 뜨고 있다면. A그룹 사람은 원래 검색하려는 것이었는데 마침 유료광고를 클릭하는 케이스가 있을 것임. 결국 B그룹은 전혀 유입이 되지 않고, A그룹이 오가닉 검색에서 유료로 넘어가는 카니발리제이션이 발생하게 됨.
      • 즉 광고가 전혀 효과가 없었다는 것을 확인할 수 있음. 문제는 우리는 어떤 유저가 기존고객인지 비고객인지 알 수가 없다.

  • 시나리오 1,2 모두 광고 없을때, 광고 있을때의 수치는 동일함.
    • 광고를 통해서 10명이 모두 유입되었다고 할때, 모두 광고효과는 둘다 +10임.
    • 그러나 실제 신규고객유입은 시나리오 1만임. → 이것은 우리가 데이터로 볼 수없다.
    • 우리는 “관찰되는 광고 효과”는 데이터로 확인가능하나, “실제 신규고객 유입”은 알 수 없음.

- 최대 4000%의 ROI. → 무조건 해야하는 것.
- 마치 유료검색의 효과가 매우 효과가 있는 것으로 보여짐. 그러나 현장에서 인과추론 실험을 했던 결과, 오히려 없거나 음수임. 즉, 하면 할수록 수익율 면에서는 손해라는 의미다. 만약 수익율이 아닌 노출자체가 중요하거나 다른 목적이 있다면 검색광고를 해야할 수도 있다.
  • 사업다각화(= 문어발식 경영)은 유효한 사업전략인가?
    • 아마존은 많은 기업들을 인수해가면서 문어발식 경영을 주도하고 있음. 사업확장을 통해 더 많은 시장점유율을 차지하는 것이 있음.
    • 기업들이 왜 사업다각화를 하는지 연구를 시작함.
    • 많은 연구들에서 “다각화와 기업가치간”에 음의 상관관계가 있다라고 함. 즉, 다각화를 할수록 기업가치가 떨어진다는 의미.
    • 이렇게 보면, 기업다각화는 하면 안되는 바보 같은 전략으로 보여짐.
    • 인과관계 연구로 봤을땐 오히려 “다각화는 기업과치와 유의한 관계가 없거나 양의 관계”를 갖는다고 나옴.
    • 다각화를 한 기업 vs. 다각화하지 않은 기업 → 이 두 집단을 비교를 해서
    • 그러나 두 그룹은 완전히 서로 다른 성격이기 때문에 애초에 비교대상이 되지 않았다.
    • 다각화를 해서 기업가치를 떨어지는 것이 아닌, 다각화를 하려는 기업이 이미 수많은 시도와 사업번영에 큰 도전을 했던 기업임.
  • 인과관계 연구의 트렌드
    • 2000년도 전까지만해도 인과관계에 대한 논문수가 많지 않았음.
    • 인과관계를 연구하는 IV(도구변수)논문수 와 DD(이중차분법)논문수가 계속해서 증가했고, 이는 모든 분야에서 인과관계를 중요시 하다는 트렌드를 의미함.
profile
성장하고 싶은 데이터분석가.

0개의 댓글