데이터스터디 1주차

윤코코·2022년 1월 5일
0

데이터 통계

목록 보기
1/1
post-thumbnail


(* 이미지 출처: yes24)

📕 책

[숫자유감]

  • 뻔한 옛날식 만화가 아니고 현대인에 맞는 유머들이 있어서
    한 챕터 읽는데 한번씩은 웃었던 듯

📖 오늘의 범위

1장, 2장

🗝 기억하면 좋을 키워드

# DAU

  • Daily Active User
  • 하루 동안 해당 서비스를 이용한 순수한 이용자의 수

1장. 상관관계와 인과관계

# 주제

  • 상관관계와 인과관계는 다르다.

# 내용

  • 상관관계는 대칭이지만, 인과관계는 비대칭이다. 비대칭이란, 원인과 결과가 바뀔 수 없다는 뜻
  • 상관/인과 관계를 분석할 때에는 과거의 값이 현재의 값에 영향을 계속 미치는 자기상관성, 누락된 변수에 대한 편향성, 컨트롤 할 수 없는 외생 변수 등의 영향을 고려해야 함
  • 오용의 대표적인 사례는 과한 상관관계 부여상관관계와 인과관계이 혼용
  • 상관계수...!

2장. 숫자의 불확실성

# 주제

  • 큰 숫자가 절대적으로도 크지 않다.

# 내용

  • 숫자 단위는 사람들의 합의하에 만들어진 기준. 사과마다 크기와 맛이 다르지만 한 덩어리의 열매라는 이유로 사과 "한 개"라고 동일하게 세는 것.
  • 데이터는 훨씬 많은 전제와 요약이 더해져서 생성된 것이기 때문에, 그 기반에 있는 수많은 가정과 합의를 이해해야 함
  • 숫자의 절대성도 사실은 수많은 사람의 공통된 전제하에 만들어진 기준이다.
  • 수학은 불확실성 위에 쌓아 올려진 학문이고, 통계는 항상 확률과 같이 등장하며, 숫자는 한 번도 절대적인 적이 없다.

# 생각

  • 여행 스타트업에서 파트너를 대상으로 일을 할때가 기억났다. 파트너의 메시지 응답률/응답시간과 여행자의 리텐션의 상관관계를 분석하려 했으나 모수가 너무 적어서 유의미한 결과를 얻을 수 없었던 마음 아픈 기억이...ㅠㅠ
  • 권대리가 마케팅 본부장에게 정색하는 게 너무 웃기다ㅋㅋㅋㅋㅋ

+ 다음에 더 알아보고 싶은 컨셉

Mau
Offerwall
골트리
이터레이션
스프린트
Omit

profile
Web Front-End Developer

0개의 댓글