[!abstract] 요약
- T-test : 2022년, 2023년 매출 데이터
- 회귀 분석 : 도요타 중고차 데이터
- 군집 분석 : 백화점 구매정보, 고객정보 데이터
- 엑셀 대시보드
[!note] 감상
- T-test
- 통계 검정 2급을 딴 이후에 오랜만에 t 검정을 접했는데 감회가 새롭다.
- 역시 일본어보단 한국어로 설명을 듣는 게 머리에 쏙 들어오는 듯 싶다.- 회귀 분석
- 분석을 행하는 데 있어서 다중공선성이 중요.
- 엑셀에서 더미 데이터를 다루는 법을 처음 알았다- 군집 분석
- 엑셀의 해 찾기 기능이 새로웟다- 대시보드
- Power BI 수업이 기대가 된다.
- 엑셀은 너무 무거운 듯?
#t-test
[!info] T-test
- 모집단의 표준편차가 알려지지 않았을 때, 정규분포 모집단에서 모은 샘플의 평균값에 대한 가설검정
- ==표본 두 집단이 통계적으로 같은지, 다른지 비교==하는 테스트
- 종류
- 대응표본 : 표본 집단 1 개를 특정 값과 비교
- 대응표본 (쌍체) : 1 개 집단의 실험 전후 비교
- 독립표본 : 두 표본 집단 비교- 양측 검정과 단측 검정
[!note]
- 매출 상위 20 브랜드
- 피벗 테이블 -> 행 레이블 -> 값 필터 -> 상위 10 -> 20 으로 변경- 작년과 중복되는 고객 찾아내기
-COUNTIF($T$7:$T$3810,P7)
[!NOTE] T-test
- t- 검정 : 쌍체 비교
- t- 독립표본
- f- 검정 : 분산에 대한 두 집단
- 등분산인가, 이분산인가
- t- 검정 : 이분산 or 등분산 가정 두 집단
#multicollinearity #dummy_variables
[!NOTE]
다중 공선성 Multicollinearity
- 
가변수 Dummy variables : 숫자가 아닌 변수의 경우
-
- 타입이 3 개면 더미는 두 개만 만들어도 됨
-
#excel/regression
[!NOTE]
- 데이터 전처리
- 상관분석을 통한 공선성이 생길 가능성 확인
- 아래의 경우 연식이랑 Diff_First Drive Year 가 많이 겹침
-- ==회귀분석==
- 데이터 -> 데이터 분석 -> 회귀 분석
-
- MET COLOR 과 DOORS 변수를 제거하고 다시 분석
- MSE, RMSE
#k-means
[!NOTE] K-means Clustering
- Process
-
-
[!NOTE] Clustering
- Tiny Data 화 -> Ref 추가 -> 각 변수의 평균과 표준편차 구하기 -> 표준화
- -> 적당한 중심점 설정 -> 군집 나누기 -> 해 찾기 (제한 조건 설정) -> 해법 옵션 설정 -> 해 찾기
[!NOTE]
[!NOTE]
- ==슬라이서==
- 삽입 -> 슬라이서
- 세세한 서식까지 지정 가능
- 열도 수정 가능
- 보고서 연결 : 다른 피벗 테이블과 슬라이서 공유- 그래프 -> 데이터 레이블 추가
- 카메라 : 테이블 자체는 카메라로