[!info] Tiny Data 란?
- 데이터 전처리에 걸리는 시간을 최소화하기 위한 표준화 데이터 형태
- 밑바닥부터 시작할 필요 없는 데이터
[!tip] 필요 조건
- 열에는 개별 변수 1 개
- 행에는 관측치
- 각 표는 1 개의 관측기준에 의해 조직
#EDA
[!info] EDA
- 수치 요약과 시각화를 사용하여 데이터를 탐색하고
변수 간 잠재적 관계 (인사이트) 를 찾아내는 프로세스[!example]
- 데이터 특성 이해
- 데이터 변동의 패턴 발견
- 이상치 발견
- 모델링 전략 수립, 방향 설정
- 분석 결과의 발견
[!quote]
' 잘못된 질문 ' 에 대한 ' 확실한 답 ' 은 결론이 확실할 수 있으나,
때론 ==' 정확한 질문 '==에 대한 ' 대략적인 답이 더 낫다 '
- John Tukey, 미국의 수학자이자 컴퓨터 과학자.
#excel/query
[!note] 쿼리를 이용한 Tiny Data 화
- 데이터 -> 테이블/범위에서 -> 쿼리 편집기 -> 변환 -> 열 피벗 해제
#excel/graph/combo
[!note] 시각화
- 콤보 그래프
- 신장률 계산 수식 복붙 팁
- IF 함수를 이용한 다른 대륙 간 계산 방지
[!note]
- 추세 탐색 : 막대 그래프, 분산 그래프, 박스 그래프
- Pivot table 열 그룹화
#excel/correlation
[!note] 상관분석
- 데이터 분석 추가
- 파일 -> 옵션 -> 추가기능 -> 분석 도구 팩- 셀 배경을 값에 따라 표시
- 홈 -> 조건부서식 -> 규칙 관리 -> 새 규칙 -> 셀 값을 기준으로 모든 셀의 서식 지정[!example] 결과
#excel/text #excel/search #excel/isnumber
[!note]
- 텍스트를 날짜 형식으로 바꾸기
- 데이터 -> 텍스트 나누기 -> 3단계 열 데이터 서식 -> 날짜 선택- 날짜를 요일로 바꾸기
-- 여러 도메인의 주소를 통합하기
-
-IF(ISNUMBER(SEARCH("google",K2)),"google",K2)
- Pivot 테이블 열 합계 비율로 나타내기
- 피벗 테이블 필드 -> 값 -> 값 필드 설정 -> 값 표시 형식 -> 열 합계 비율