데이터 분석 및 시각화 / 강의 소개

권나영·2021년 9월 30일
0

EDA vs CDA

탐색적 데이터 분석(EDA) :

가설이나 모델 없이 데이터 속성, 특징, 품질, 구조에 대한 탐구

확증적 데이터 분석 (CDA) :

  • 추측, 가설, 모델 또는 결론이 타당한가 데이터에 대해 확인하는 과정
  • 모델 적합도, 가설 검정, 신뢰 구간 등을 이용

즉, EDA는 “이 데이터를 만든 데이터 생성 프로세스는 이럴 것이야” 와 같은 가설이나 모델을 세우고 그것을 검증하는 방법이 아니라, 데이터가 갖고 있는 본연의 의미나 속성을 알고자 하는 방법

통계적 모델


표본으로부터 모집단에서의 데이터생성 과정의 (진짜) 확률 분포를
추정하려 함.
간단히 말하면, “데이터를 이해하기위해 만든 수학적 모델”

예) 회귀분석

자식의 키는 아마도 부모의 키와 성장기의 영양섭취와 관계 있을 것이라는 가설하에 자식의 키를 추정하는 통계적 모델을 만들자

profile
나영

0개의 댓글