Data Wrangling
- 원자료(raw data)를 쉽고 효율적으로 가공하고 분석할 수 있도록 변환하는 과정
- 데이터 랭글링(Data Wrangling)의 6단계
- Discovering : 데이터에 대한 깊은 이해를 하는 단계
- Structuring : 필요없는 행/컬럼 삭제 및 분석 가능한 형태로 구조화하는 단계
- Cleaning : 데이터 이상치 결측치를 발견하고 처리하는 단계
- Enriching : 데이터를 풍부하게 하기 위한 전략을 짜는 단계
- Validating : 데이터의 분포 등을 검정하는 단계
- Publishing : 데이터를 분석 모델의 인풋으로 입력하는 단계