ex) 어떤 feature가 목표에 맞는 상관관계를 가질까
ex) 목표와 관련이 있는 feature를 완성하는 것
feature를 활용해 또 다른 feature를 완성시키는 것
ex) feature의 형상을 바꾸기
필요가 없는 feature를 drop
feature를 활용해 새로운 feature를 추가
1, 2, 3을 통해 가정을 더 세우고 분류한다.
관찰과 가정을 확인하기 위해, feature를 전략을 바꿈으로써
feature의 상관관계를 빠르게 분석할 수 있다.
이 단계에서는 빈 값이 없는 형상에 대해서만 이 작업을 수행할 수 있다.
또한 범주형, 서수형 또는 이산형 유형의 형상에 대해서만 그렇게 하는 것이 타당하다.
데이터를 분석하기 위한 시각화를 사용하여 가정을 확인할 수 있다.
=> 데이터에 맞는 시각화를 선택해서 사용해야 한다.
데이터 세트의 가정과 결정을 수집하고 수정과 삭제를 행한다.
feature을 삭제함으로써 속도를 높히고 분석에 용이
또한 일관성을 위하여 모든 데이터에 수행
정규식 또는 연산을 통하여 수행
빈도수가 많은 데이터를 모으고 매핑
feature의 특성을 찾아 추정 후 채우기
당신의 시간이 헛되지 않는 글이 되겠습니다.
I'll write something that won't waste your time.